-
公开(公告)号:CN115795466B
公开(公告)日:2023-06-20
申请号:CN202310067439.5
申请日:2023-02-06
Applicant: 广东省科技基础条件平台中心 , 暨南大学
IPC: G06F21/56
Abstract: 本发明公开了一种恶意软件组织识别方法及设备,该方法包括:获取待识别的当前恶意软件样本;对当前恶意软件样本进行预处理,提取其属性信息和特征表示向量,并存储到样本特征数据集中;根据当前恶意软件样本的特征表示向量,使用预先训练好的恶意软件组织识别模型进行识别,获得组织识别结果;根据样本特征数据集中的各个恶意软件样本的属性信息,将样本特征数据集中的各个恶意软件样本划分为新样本数据集和旧样本数据集,以检测样本是否发生概念偏移;若是则将当前恶意软件样本的组织识别结果更新到样本特征数据集中,并采用更新后样本特征数据集重新训练恶意软件组织识别模型,可以克服恶意软件样本在现实中可能存在的概念漂移问题。
-
公开(公告)号:CN115795466A
公开(公告)日:2023-03-14
申请号:CN202310067439.5
申请日:2023-02-06
Applicant: 广东省科技基础条件平台中心 , 暨南大学
IPC: G06F21/56
Abstract: 本发明公开了一种恶意软件组织识别方法及设备,该方法包括:获取待识别的当前恶意软件样本;对当前恶意软件样本进行预处理,提取其属性信息和特征表示向量,并存储到样本特征数据集中;根据当前恶意软件样本的特征表示向量,使用预先训练好的恶意软件组织识别模型进行识别,获得组织识别结果;根据样本特征数据集中的各个恶意软件样本的属性信息,将样本特征数据集中的各个恶意软件样本划分为新样本数据集和旧样本数据集,以检测样本是否发生概念偏移;若是则将当前恶意软件样本的组织识别结果更新到样本特征数据集中,并采用更新后样本特征数据集重新训练恶意软件组织识别模型,可以克服恶意软件样本在现实中可能存在的概念漂移问题。
-
公开(公告)号:CN114047929B
公开(公告)日:2022-05-03
申请号:CN202210029556.8
申请日:2022-01-12
Applicant: 广东省科技基础条件平台中心 , 暨南大学
Abstract: 本发明公开了一种基于知识增强的用户定义函数识别方法、装置及介质,包括:对用户定义函数的反汇编文本进行预处理和划分处理,获得训练数据集;对其操作码进行词嵌入,生成词向量;将词向量输入Transformer模型,获取经过初始预训练过的Transformer模型;对预设数量阈值的词向量进行遮罩处理;将所有词向量输入到经过初始预训练过的Transformer模型,输出词向量的编码结果并将其作为反汇编文本的编码特征信息,将统计特征转换为三通道的图像以获取反汇编文本的统计特征信息,并将统计特征信息和编码特征信息进行拼接,输入全连接神经网络中,得到用户定义函数分类模型。本发明实施例能够准确识别用户定义函数。
-
公开(公告)号:CN112668009A
公开(公告)日:2021-04-16
申请号:CN202110107338.7
申请日:2021-01-27
Applicant: 暨南大学
Abstract: 本发明公开了一种基于层次注意力网络模型的恶意软件分类方法,其中包括对恶意软件PE样本进行反汇编,对应的获取汇编代码文件;从所述汇编代码文件中提取操作码序列,生成操作码序列文档;对所述操作码序列文档中的每一个操作码进行词嵌入,即生成词向量;将操作码序列文档送入层次注意力网络模型,输出注意力权重矩阵和分类结果;根据注意力权重矩阵对操作码序列进行图片可视化,通过权重矩阵的权重值大小对应的颜色深浅说明每个操作码、每个操作码序列对于分类的重要性。本方法能够在自动分类的同时,找出对于分类起贡献作用的操作码序列从而提供分类依据。该方法在测试集上的准确率达到96.96%,说明该方法识别效果十分良好。
-
公开(公告)号:CN112000952B
公开(公告)日:2022-05-24
申请号:CN202010741380.X
申请日:2020-07-29
Applicant: 暨南大学
Abstract: 本发明公开了一种Windows平台恶意软件的作者组织特征工程方法,首先获取样本集;针对于样本集中的各样本,提取多粒度多级别的恶意软件静态特征,包括PE文件特征、文件字节特征、反汇编文件特征、操作数和指令特征、函数特征、程序图特征、以及函数的质心特征;接着对上提取的静态特征,得到数值类型特征后进行拼接,得到样本的特征向量;最后针对于各样本,基于消融实验和互信息法进行特征选择,挑选出最适合用于作者组织溯源分类的特征集合。通过本发明方法所确定出来的静态特征,对恶意软件作者组织进行溯源分类时,在检测的准确率、精确率、召回率、F1分数上都具有较好的效果,能够大大提高恶意软件作者组织分类的准确率。
-
公开(公告)号:CN114047929A
公开(公告)日:2022-02-15
申请号:CN202210029556.8
申请日:2022-01-12
Applicant: 广东省科技基础条件平台中心 , 暨南大学
Abstract: 本发明公开了一种基于知识增强的用户定义函数识别方法、装置及介质,包括:对用户定义函数的反汇编文本进行预处理和划分处理,获得训练数据集;对其操作码进行词嵌入,生成词向量;将词向量输入Transformer模型,获取经过初始预训练过的Transformer模型;对预设数量阈值的词向量进行遮罩处理;将所有词向量输入到经过初始预训练过的Transformer模型,输出词向量的编码结果并将其作为反汇编文本的编码特征信息,将统计特征转换为三通道的图像以获取反汇编文本的统计特征信息,并将统计特征信息和编码特征信息进行拼接,输入全连接神经网络中,得到用户定义函数分类模型。本发明实施例能够准确识别用户定义函数。
-
公开(公告)号:CN112000952A
公开(公告)日:2020-11-27
申请号:CN202010741380.X
申请日:2020-07-29
Applicant: 暨南大学
Abstract: 本发明公开了一种Windows平台恶意软件的作者组织特征工程方法,首先获取样本集;针对于样本集中的各样本,提取多粒度多级别的恶意软件静态特征,包括PE文件特征、文件字节特征、反汇编文件特征、操作数和指令特征、函数特征、程序图特征、以及函数的质心特征;接着对上提取的静态特征,得到数值类型特征后进行拼接,得到样本的特征向量;最后针对于各样本,基于消融实验和互信息法进行特征选择,挑选出最适合用于作者组织溯源分类的特征集合。通过本发明方法所确定出来的静态特征,对恶意软件作者组织进行溯源分类时,在检测的准确率、精确率、召回率、F1分数上都具有较好的效果,能够大大提高恶意软件作者组织分类的准确率。
-
-
-
-
-
-