融合深度子树交互的代码克隆检测方法、装置及电子设备

    公开(公告)号:CN118051257A

    公开(公告)日:2024-05-17

    申请号:CN202311825583.7

    申请日:2023-12-27

    Applicant: 清华大学

    Abstract: 本发明提供一种融合深度子树交互的代码克隆检测方法、装置及电子设备,其中的方法包括:获取基准代码块对应的第一抽象语法树,以及待检测代码块对应的第二抽象语法树;将第一抽象语法树划分为多棵第一子树,并将第二抽象语法树划分为多棵第二子树;计算第一子树与第二子树的子树相似度,以及第一抽象语法树与第二抽象语法树的语法树相似度;根据子树相似度和语法树相似度,获取待检测代码块的代码克隆检测结果。该方法通过以代码块为检测粒度,在比较抽象语法树级别的相似度的基础上,将子树级别的相似度也纳入代码克隆检测范畴,极大地提升了代码克隆检测的精确度和召回度,具有广泛的应用价值。

    基于神经网络和函数调用图的二进制成分检测方法及系统

    公开(公告)号:CN117454382A

    公开(公告)日:2024-01-26

    申请号:CN202310760533.9

    申请日:2023-06-26

    Applicant: 清华大学

    Inventor: 唐伟 张翼 罗平

    Abstract: 本发明提供一种基于神经网络和函数调用图的二进制成分检测方法及系统,获取组件文件和检测目标文件,进行文件处理获取文件中有效二进制文件成分;进行逆向分析提取常量特征和代码语义特征,通过神经网络将代码语义特征映射至新的特征空间;基于专家经验规则对常量特征进行哈希碰撞,获取第一初步候选者;在新的特征空间内利用向量检索获取最近邻结果,获取第二初步候选者;基于相似函数节点映射关系对函数调用图进行同质化压缩并进行相似性比较,获得二进制文件相似性,对所有初步候选者进行过滤,获取最终匹配结果;对组件版本进行排序,获取最佳匹配版本,完成二进制成分检测。本发明解决了现有二进制软件成分检测能力差、准确性低的问题。

    一种对离散余弦变换域数字水印系统的自适应攻击方法

    公开(公告)号:CN101159059B

    公开(公告)日:2010-09-29

    申请号:CN200710178089.0

    申请日:2007-11-26

    Applicant: 清华大学

    Abstract: 本发明公开了一种对离散余弦变换域数字水印系统的自适应攻击方法,属于数字水印技术领域。所述方法包括:获取数字水印图像;将数字水印图像分成若干个,n×n像素的子块,获取子块的人类视觉系统分类结果,得到迭加的水印分量的强度;采用周期性变换矩阵对每一个子块进行一次攻击,得到经过攻击的子块矩阵,周期性变换矩阵应满足下述两式:(1)m(Xn)=AmXn(modN),其中,A为周期性变换矩阵,A=(aij)n×n,aij为整数,m(Xn)=Xn,Xn为原始分块的子块矩阵,Xn=(x1,...,xn)T,Xn′=(x1′,...,xn′)T,x1,...,xn∈{0,l,...,N-1},N是变换的阶数;(2)其中, mN为变换Xn′=(Xn)的周期,En为n阶单位矩阵;计算峰值信噪比,选择再次攻击或输出图像。采用本发明的方法能检验现有数字水印系统鲁棒性,由于攻击和恢复采用同一方法,运算简单有效,可以促进数字水印系统发展。

    二进制代码相似性检测方法、装置及电子设备

    公开(公告)号:CN117951543A

    公开(公告)日:2024-04-30

    申请号:CN202410033687.2

    申请日:2024-01-09

    Applicant: 清华大学

    Inventor: 张翼 罗平

    Abstract: 本发明提供一种二进制代码相似性检测方法、装置及电子设备,其中的方法包括:对待检测二进制代码的编译属性特征进行编译优化等级分类,得到编译优化等级;对待检测二进制代码的功能属性特征进行编码处理,得到初步功能特征向量;基于编译优化等级,对初步功能特征向量进行适配,得到目标功能特征向量;根据两组不同的待检测二进制代码的目标功能特征向量,获取两组不同的待检测二进制代码的相似性检测结果。该方法通过对待检测二进制代码进行编译属性和功能属性两方面的分析,对于不同编译条件下的功能特征向量进行不同的适配处理,将不同编译条件下的相似函数映射到向量空间中距离较近的特征向量,实现了不同二进制代码相似性的高精度检测。

    利用三维立体图标防伪的方法

    公开(公告)号:CN101216930A

    公开(公告)日:2008-07-09

    申请号:CN200810055862.9

    申请日:2008-01-10

    Applicant: 清华大学

    Abstract: 利用三维立体图标防伪的方法,属于信息安全领域。为了既能三维立体显示图标,又能在三维显示的图标中隐藏秘密图像信息,本发明公开了利用三维立体图标防伪的方法,包括获取参数,输入秘密图像和灰度图像;然后利用可视分存方法构造n幅可视分存图,利用三维立体画方法构造n幅三维立体图,调整所述n幅可视分存图和所述n幅三维立体图大小并分成多个基本块;最后随机选取可视分存图或三维立体图中相应位置处的基本块,构造n幅三维立体可视分存图标等步骤。本发明通过数据融合技术,将可视分存技术和三维立体画技术结合起来,所生成的n幅图标每一幅单独是三维立体画;又可以在三维立体画中分存隐藏秘密信息。

    二进制文件相似性分析方法、系统、设备及存储介质

    公开(公告)号:CN118568516A

    公开(公告)日:2024-08-30

    申请号:CN202410700555.0

    申请日:2024-05-31

    Applicant: 清华大学

    Inventor: 张翼 宋鼎宏 罗平

    Abstract: 本发明提供一种二进制文件相似性分析方法、系统、设备及存储介质,首先对二进制的主文件和二进制的比对文件进行二进制文件逆向,然后对逆向得到的主文件的二进制函数信息和比对文件的二进制函数信息进行特征提取,之后将得到的主文件的初始特征向量和比对文件的初始特征向量输入预训练的二进制函数嵌入模型,得到二进制函数嵌入模型输出的主文件的函数嵌入特征向量和比对文件的函数嵌入特征向量;根据主文件的函数嵌入特征向量和比对文件的函数嵌入特征向量,基于近邻搜索算法确定备选的相似函数对;基于最大权重匹配算法对备选的相似函数对进行最佳匹配求解,得到匹配的相似函数对,能够在复杂场景下实现对二进制文件相似性的准确、高效分析。

    基于依赖生命周期模型的源码依赖检测方法及系统

    公开(公告)号:CN117032731A

    公开(公告)日:2023-11-10

    申请号:CN202310807451.5

    申请日:2023-07-03

    Applicant: 清华大学

    Inventor: 唐伟 罗平

    Abstract: 本发明提供一种基于依赖生命周期模型的源码依赖检测方法及系统,包括:对目标源码库中的文件类型进行扫描检测,识别提取有效文件;基于预设的依赖生命周期模型中通过使用依赖管理工具环节构建设计相应软件物料清单文件的语法解析方法;基于预设的依赖生命周期模型中通过使用代码克隆的环节集成代码克隆检测方法;将所述语法解析方法和代码克隆检测方法集成至统一流程,去重后作为最终检测结果,实现可扩展的覆盖依赖全生命周期的C/C++源码依赖检测方法;其中,所述预设的依赖生命周期模型是通过基于C/C++软件开发流程构造的。本发明解决现有源码依赖检测无法针对大规模软件生态实施、检测准确性低的问题。

    一种对离散余弦变换域数字水印系统的自适应攻击方法

    公开(公告)号:CN101159059A

    公开(公告)日:2008-04-09

    申请号:CN200710178089.0

    申请日:2007-11-26

    Applicant: 清华大学

    Abstract: 本发明公开了一种对离散余弦变换域数字水印系统的自适应攻击方法,属于数字水印技术领域。所述方法包括:获取数字水印图像;将数字水印图像分成若干个n×n像素的子块,获取子块的人类视觉系统分类结果,得到迭加的水印分量的强度;采用周期性变换矩阵对每一个子块进行一次攻击,得到经过攻击的子块矩阵,周期性变换矩阵应满足下述两式:(1)φm(Xn)=AmXn(modN),其中,A为周期性变换矩阵,A=(aij)n×n,aij为整数,φm(Xn),Xn为原始分块的子块矩阵,Xn=(x1,…,xn)T,Xn′=(x1′,…,xn′)T,x1,…,xn∈{0,1,…,N-1},N是变换的阶数;(2)AmN(modN)=En,其中,mN为变换Xn′=φ(Xn)的周期,En为n阶单位矩阵;计算峰值信噪比,选择再次攻击或输出图像。采用本发明的方法能检验现有数字水印系统鲁棒性,由于攻击和恢复采用同一方法,运算简单有效,可以促进数字水印系统发展。

    一种二进制代码的克隆检测方法及系统

    公开(公告)号:CN118567715A

    公开(公告)日:2024-08-30

    申请号:CN202410700489.7

    申请日:2024-05-31

    Applicant: 清华大学

    Inventor: 宋鼎宏 张翼 罗平

    Abstract: 本发明提供一种二进制代码的克隆检测方法及系统,该方法包括:基于二进制代码确定二进制函数的静态汇编代码和动态执行轨迹;根据静态汇编代码和动态执行轨迹确定无标注的二进制函数数据集;根据无标注的二进制函数数据集,采用自监督掩码学习的方式预训练语言模型,得到训练后的语言模型,以使语言模型学习二进制函数的执行语义;根据有标注的二进制函数数据集,对训练后的语言模型进行有监督的微调训练,得到微调后的语言模型;根据微调后的语言模型进行二进制代码克隆检测。本发明不仅能够通过预训练的语言模型自动提取除对二进制代码的克隆检测的特征,省去大量的特征工程开销,而且具有较强的泛化能力,可以应用于不同的平台和编译环境中。

    利用三维立体图标防伪的方法

    公开(公告)号:CN100583140C

    公开(公告)日:2010-01-20

    申请号:CN200810055862.9

    申请日:2008-01-10

    Applicant: 清华大学

    Abstract: 利用三维立体图标防伪的方法,属于信息安全领域。为了既能三维立体显示图标,又能在三维显示的图标中隐藏秘密图像信息,本发明公开了利用三维立体图标防伪的方法,包括获取参数,输入秘密图像和灰度图像;然后利用可视分存方法构造n幅可视分存图,利用三维立体画方法构造n幅三维立体图,调整所述n幅可视分存图和所述n幅三维立体图大小并分成多个基本块;最后随机选取可视分存图或三维立体图中相应位置处的基本块,构造n幅三维立体可视分存图标等步骤。本发明通过数据融合技术,将可视分存技术和三维立体画技术结合起来,所生成的n幅图标每一幅单独是三维立体画;又可以在三维立体画中分存隐藏秘密信息。

Patent Agency Ranking