一种代码作者性别确定方法、装置、设备和介质

    公开(公告)号:CN116821344A

    公开(公告)日:2023-09-29

    申请号:CN202310826029.4

    申请日:2023-07-07

    Abstract: 本发明公开了一种代码作者性别确定方法、装置、设备和介质,涉及计算机技术领域。先确定作为训练样本的代码以及对代码作者的标注性别,然后基于社会学和心理学中的性别差异,对代码的风格属性进行划分,确定训练样本对应各风格属性的性别统计信息,之后将各性别统计信息进行拼接并输入分类器中确定代码作者的预测性别,并以最小化预测性别与标注性别之间的偏差为优化目标对分类器进行训练,以通过训练后的分类器确定代码作者性别。本方案基于性别差异在代码写作中的表现,将代码中能够体现性别差异的风格属性对应的性别统计信息作为输入对分类器进行训练,使得训练后的分类器能够学习到代码中不同性别的风格属性特征,从而有效确定代码作者性别。

    一种代码复用路径的搜索方法、装置、设备及介质

    公开(公告)号:CN118585180A

    公开(公告)日:2024-09-03

    申请号:CN202410731418.3

    申请日:2024-06-06

    Abstract: 本申请的实施例涉及计算机软件技术领域,公开了一种代码复用路径的搜索方法、装置、设备及介质。上述方法包括:获取通过RSPL语言定义的分别用于描述不同复用语义的若干条RSPL语句;获取待搜索的目标二进制文件,目标二进制文件包括若干个语义组件,每个语义组件具有一种语义功能;从若干个语义组件中搜索能够实现每条RSPL语句的复用语义功能的语义组件,作为目标语义组件;将所有目标语义组件中存在连通关系与数据依赖关系的目标语义组件缝合,以生成多条符合目标二进制文件的控制流图的代码复用路径;其中,每条代码复用路径中的各目标语义组件之间的排列顺序根据每个目标语义组件的利用价值确定,以实现代码复用路径的自动化搜索。

    混淆恶意代码的检测方法、装置、电子设备及存储介质

    公开(公告)号:CN117892304A

    公开(公告)日:2024-04-16

    申请号:CN202410075663.3

    申请日:2024-01-18

    Abstract: 本申请的实施例公开了一种混淆恶意代码的检测方法、装置、电子设备及存储介质,该方法包括:获取混淆代码的由多个节点和多条有向边组成的抽象语法树和数据流图;基于随机游走算法,游走抽象语法树中的多个节点和多条有向边,获取抽象语法树对应的多条第一游走路径,并游走数据流图中的多个节点和多条有向边,获取数据流图对应的多条第二游走路径;一条第一游走路径对应一条第二游走路径,对应的第一游走路径和第二游走路径中所包含的节点在混淆代码中的位置相近,且对应的第一游走路径和第二游走路径中处于同一位置的节点在混淆代码中的位置相近;结合多条第一游走路径和多条第二游走路径,对混淆代码进行检测,以确定混淆代码是否为恶意代码。

    指令级代码复用分析方法及指令级代码复用方法

    公开(公告)号:CN115237405A

    公开(公告)日:2022-10-25

    申请号:CN202210672521.6

    申请日:2022-06-14

    Abstract: 本发明公开了一种指令级代码复用分析方法及指令级代码复用方法,属于代码分析与复用领域,包括:通过在目标二进制代码的每条指令处插桩第一回调函数的方式,识别出其中的Gadgets,得到初始Gadgets集合;通过动态污点分析技术从初始Gadgets集合中筛选出被污染的Gadgets,作为可用Gadgets;对于每一个可用Gadgets,利用符号执行技术,获取从符号执行起点位置运行至该可用Gadgets的执行路径,构建路径约束表达式并求解得到路径约束值,若成功获取到执行路径并成功求解出路径约束值,则将该可用Gadgets作为可复用Gadgets;将所有可复用Gadgets及其路径约束值作为识别结果,识别结束。本发明能够提高代码复用精度,确保搜索出的Gadgets具备可达性,同时利于代码投毒分析。

    图张量神经网络模型建立方法及源代码语义识别方法

    公开(公告)号:CN114327483B

    公开(公告)日:2024-10-18

    申请号:CN202111665944.7

    申请日:2021-12-31

    Abstract: 本发明公开了一种图张量神经网络模型建立方法及源代码语义识别方法,属于软件分析检测领域,方法包括:建立图张量构建网络层,用于从源代码中提取AST、CFG、DDG和NCS的图结构并组合得到图张量空间特征;建立门控图张量神经网络层,用于利用图张量空间特征计算源代码的图结构节点的隐藏层特征;建立图张量卷积神经网络层,用于利用隐藏层特征提取图结构节点的语义特征;建立输出网络层,用于根据语义特征利用分层softmax函数预测源代码中的变量,和/或,预测源代码中缺失的变量;将训练样本输入包含各网络层的图张量神经网络模型,利用反向传播训练模型中的权重参数。该图张量神经网络模型的源代码语义识别更准确,且效率更高。

    图张量神经网络模型建立方法及源代码语义识别方法

    公开(公告)号:CN114327483A

    公开(公告)日:2022-04-12

    申请号:CN202111665944.7

    申请日:2021-12-31

    Abstract: 本发明公开了一种图张量神经网络模型建立方法及源代码语义识别方法,属于软件分析检测领域,方法包括:建立图张量构建网络层,用于从源代码中提取AST、CFG、DDG和NCS的图结构并组合得到图张量空间特征;建立门控图张量神经网络层,用于利用图张量空间特征计算源代码的图结构节点的隐藏层特征;建立图张量卷积神经网络层,用于利用隐藏层特征提取图结构节点的语义特征;建立输出网络层,用于根据语义特征利用分层softmax函数预测源代码中的变量,和/或,预测源代码中缺失的变量;将训练样本输入包含各网络层的图张量神经网络模型,利用反向传播训练模型中的权重参数。该图张量神经网络模型的源代码语义识别更准确,且效率更高。

Patent Agency Ranking