-
公开(公告)号:CN116821344A
公开(公告)日:2023-09-29
申请号:CN202310826029.4
申请日:2023-07-07
Applicant: 华中科技大学
IPC: G06F16/35 , G06F40/253 , G06F18/214 , G06F18/243 , G06F8/75
Abstract: 本发明公开了一种代码作者性别确定方法、装置、设备和介质,涉及计算机技术领域。先确定作为训练样本的代码以及对代码作者的标注性别,然后基于社会学和心理学中的性别差异,对代码的风格属性进行划分,确定训练样本对应各风格属性的性别统计信息,之后将各性别统计信息进行拼接并输入分类器中确定代码作者的预测性别,并以最小化预测性别与标注性别之间的偏差为优化目标对分类器进行训练,以通过训练后的分类器确定代码作者性别。本方案基于性别差异在代码写作中的表现,将代码中能够体现性别差异的风格属性对应的性别统计信息作为输入对分类器进行训练,使得训练后的分类器能够学习到代码中不同性别的风格属性特征,从而有效确定代码作者性别。
-
公开(公告)号:CN118585180A
公开(公告)日:2024-09-03
申请号:CN202410731418.3
申请日:2024-06-06
Abstract: 本申请的实施例涉及计算机软件技术领域,公开了一种代码复用路径的搜索方法、装置、设备及介质。上述方法包括:获取通过RSPL语言定义的分别用于描述不同复用语义的若干条RSPL语句;获取待搜索的目标二进制文件,目标二进制文件包括若干个语义组件,每个语义组件具有一种语义功能;从若干个语义组件中搜索能够实现每条RSPL语句的复用语义功能的语义组件,作为目标语义组件;将所有目标语义组件中存在连通关系与数据依赖关系的目标语义组件缝合,以生成多条符合目标二进制文件的控制流图的代码复用路径;其中,每条代码复用路径中的各目标语义组件之间的排列顺序根据每个目标语义组件的利用价值确定,以实现代码复用路径的自动化搜索。
-
公开(公告)号:CN117892304A
公开(公告)日:2024-04-16
申请号:CN202410075663.3
申请日:2024-01-18
Applicant: 华中科技大学
Abstract: 本申请的实施例公开了一种混淆恶意代码的检测方法、装置、电子设备及存储介质,该方法包括:获取混淆代码的由多个节点和多条有向边组成的抽象语法树和数据流图;基于随机游走算法,游走抽象语法树中的多个节点和多条有向边,获取抽象语法树对应的多条第一游走路径,并游走数据流图中的多个节点和多条有向边,获取数据流图对应的多条第二游走路径;一条第一游走路径对应一条第二游走路径,对应的第一游走路径和第二游走路径中所包含的节点在混淆代码中的位置相近,且对应的第一游走路径和第二游走路径中处于同一位置的节点在混淆代码中的位置相近;结合多条第一游走路径和多条第二游走路径,对混淆代码进行检测,以确定混淆代码是否为恶意代码。
-
公开(公告)号:CN115237405A
公开(公告)日:2022-10-25
申请号:CN202210672521.6
申请日:2022-06-14
Applicant: 华中科技大学
Abstract: 本发明公开了一种指令级代码复用分析方法及指令级代码复用方法,属于代码分析与复用领域,包括:通过在目标二进制代码的每条指令处插桩第一回调函数的方式,识别出其中的Gadgets,得到初始Gadgets集合;通过动态污点分析技术从初始Gadgets集合中筛选出被污染的Gadgets,作为可用Gadgets;对于每一个可用Gadgets,利用符号执行技术,获取从符号执行起点位置运行至该可用Gadgets的执行路径,构建路径约束表达式并求解得到路径约束值,若成功获取到执行路径并成功求解出路径约束值,则将该可用Gadgets作为可复用Gadgets;将所有可复用Gadgets及其路径约束值作为识别结果,识别结束。本发明能够提高代码复用精度,确保搜索出的Gadgets具备可达性,同时利于代码投毒分析。
-
公开(公告)号:CN114327483B
公开(公告)日:2024-10-18
申请号:CN202111665944.7
申请日:2021-12-31
Applicant: 华中科技大学
IPC: G06F8/41 , G06F11/36 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种图张量神经网络模型建立方法及源代码语义识别方法,属于软件分析检测领域,方法包括:建立图张量构建网络层,用于从源代码中提取AST、CFG、DDG和NCS的图结构并组合得到图张量空间特征;建立门控图张量神经网络层,用于利用图张量空间特征计算源代码的图结构节点的隐藏层特征;建立图张量卷积神经网络层,用于利用隐藏层特征提取图结构节点的语义特征;建立输出网络层,用于根据语义特征利用分层softmax函数预测源代码中的变量,和/或,预测源代码中缺失的变量;将训练样本输入包含各网络层的图张量神经网络模型,利用反向传播训练模型中的权重参数。该图张量神经网络模型的源代码语义识别更准确,且效率更高。
-
公开(公告)号:CN116841611A
公开(公告)日:2023-10-03
申请号:CN202310826032.6
申请日:2023-07-07
Applicant: 华中科技大学
IPC: G06F8/75 , G06F16/35 , G06F40/211 , G06F40/253 , G06F18/213 , G06F18/214 , G06F18/24 , G06F18/25 , G06F18/2411 , G06F18/243
Abstract: 本发明公开了一种代码作者归属确定方法、装置、设备及介质,先确定训练样本以及标注的代码作者,然后对代码的风格属性进行划分,确定训练样本对应每种风格属性的归属统计信息,接着将各归属统计信息分别输入不同特征提取分类器,根据标注作者对各特征提取分类器进行训练,以及将特征提取分类器的特征提取层提取到的归属特征进行拼接并输入综合分类器,根据标注作者对综合分类器进行训练,最后获取待确定作者归属的未知代码,通过训练后的特征提取分类器和综合分类器,确定代码作者归属。通过对代码的风格属性进行划分,采用多个特征提取分类器进行特征提取,避免了特征忽略,提高了综合分类器的特征利用,从而提高了代码作者归属确定的准确率。
-
公开(公告)号:CN116723005A
公开(公告)日:2023-09-08
申请号:CN202310579773.9
申请日:2023-05-23
Applicant: 华中科技大学
IPC: H04L9/40 , G06F21/56 , G06F40/295 , G06N3/0464 , G06N3/088
Abstract: 本发明公开了一种多态隐藏下的恶意代码隐式情报追踪方法及系统,是一种基于跨域隐式情报分析对恶意代码作者进行身份溯源的方法,并使用此方法构建了一个系统,可以在截取到恶意代码的前提下,追踪分析此代码可能的来源仓库和作者,并能通过人工智能算法提供作者的身份画像信息,从而为打击网络犯罪,追踪黑客团伙提供线索。通过本系统还能对国际知名网络安全研究组织、黑客技术团队在网络平台的活动进行监控,起到对新型网络攻击及时预警和防范的作用。
-
公开(公告)号:CN114327483A
公开(公告)日:2022-04-12
申请号:CN202111665944.7
申请日:2021-12-31
Applicant: 华中科技大学
Abstract: 本发明公开了一种图张量神经网络模型建立方法及源代码语义识别方法,属于软件分析检测领域,方法包括:建立图张量构建网络层,用于从源代码中提取AST、CFG、DDG和NCS的图结构并组合得到图张量空间特征;建立门控图张量神经网络层,用于利用图张量空间特征计算源代码的图结构节点的隐藏层特征;建立图张量卷积神经网络层,用于利用隐藏层特征提取图结构节点的语义特征;建立输出网络层,用于根据语义特征利用分层softmax函数预测源代码中的变量,和/或,预测源代码中缺失的变量;将训练样本输入包含各网络层的图张量神经网络模型,利用反向传播训练模型中的权重参数。该图张量神经网络模型的源代码语义识别更准确,且效率更高。
-
-
-
-
-
-
-