-
公开(公告)号:CN107729754B
公开(公告)日:2020-04-14
申请号:CN201710871516.7
申请日:2017-09-25
Applicant: 暨南大学
IPC: G06F21/56
Abstract: 本发明公开了一种基于API特征的Android恶意软件检测方法,步骤:构建第一训练样本集和第二训练样本集,提取各训练样本API特征向量;由根据d值挑选出各种API特征构成第一API集合;构建API特征的层次结构模型,生成第二层和第三层对应的第一成对比较矩阵和各API包的第二成对比较矩阵,针对各成对比较矩阵计算权向量;计算第一API集合中各种API特征的权值:根据测试样本API特征向量和第一API集合中各种API特征的权值计算测试样本所调用API特征的权重η;最后将η与判断因子k作比较,根据比较结果判断出测试样本是否为Android恶意软件,大大提高了Android恶意软件的检测准确率。
-
公开(公告)号:CN110717324A
公开(公告)日:2020-01-21
申请号:CN201910840224.6
申请日:2019-09-06
Applicant: 暨南大学
IPC: G06F40/205 , G06F40/295 , G06F40/126 , G06F16/35 , G06F16/332 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种裁判文书答案信息提取方法、装置、提取器、介质和设备,首先针对于训练样本集中的数据包括裁判文书、问题以及参考答案进行以中文词汇为粒度的分词处理,然后针对于分词获取到的各词块进行编码,得到各词块的文本特征;然后通过各训练样本中各词块的文本特征对ERNIE模型进行训练,得到预测模型;通过训练样本针对深度神经网络进行训练,得到答案验证模型;在进行测试时,将裁判文书和问题进行分词和编码处理后均输入到预测模型中得到预测答案,将预测答案输入到答案验证模型进行验证,在验证通过的情况下,将预测答案作为最终答案,否则判定无解。本发明大大提高了裁判文书答案信息提取的准确度。
-
公开(公告)号:CN117113351A
公开(公告)日:2023-11-24
申请号:CN202311345558.9
申请日:2023-10-18
Applicant: 广东省科技基础条件平台中心 , 暨南大学
IPC: G06F21/56 , G06F40/126 , G06F8/53
Abstract: 本发明公开了一种基于多重多级预训练的软件分类方法及设备,所述方法包括:对二进制软件进行反汇编得到反汇编代码文本;对反汇编代码文本进行预处理,并从预处理后的反汇编代码文本中筛选出用户定义函数,得到类反汇编代码文本并输入到文本表征生成模块,得到文本表征;基于二进制软件中的字节统计特征、PE文件统计特征,以及反汇编代码文本中的反汇编统计特征,确定统计特征向量并输入至统计表征生成模块,得到统计表征;对文本表征和统计表征进行融合处理,得到样本表征并输入至分类网络模型,得到二进制软件的代码分类识别结果。本发明能够实现高精度的软件分类。
-
公开(公告)号:CN117093997A
公开(公告)日:2023-11-21
申请号:CN202311360685.6
申请日:2023-10-20
Applicant: 广东省科技基础条件平台中心 , 暨南大学
Abstract: 本发明公开了一种基于平稳多臂老虎机的代码对抗样本生成方法,包括:获取代码数据集,并创建多个代理对象;从代码数据集中获取一个第一代码样本;通过代码对抗样本生成模型中的攻击器,基于多个代理对象进行代理采样和代理投票处理,确定注入动作,并将注入动作注入第一代码样本,得到第二代码样本;对第二代码样本进行逃逸检测,并将逃逸成功的第二代码样本加入对抗样本集;在进行逃逸检测后,当第二代码样本不满足结束条件时,返回至获取第一代码样本的步骤获取新的第一代码样本,以进行迭代,直至获取到的新的第二代码样本满足结束条件时停止迭代,并获取停止迭代后的对抗样本集,本发明能够高效生成大量高质量的代码对抗样本。
-
公开(公告)号:CN112000952B
公开(公告)日:2022-05-24
申请号:CN202010741380.X
申请日:2020-07-29
Applicant: 暨南大学
Abstract: 本发明公开了一种Windows平台恶意软件的作者组织特征工程方法,首先获取样本集;针对于样本集中的各样本,提取多粒度多级别的恶意软件静态特征,包括PE文件特征、文件字节特征、反汇编文件特征、操作数和指令特征、函数特征、程序图特征、以及函数的质心特征;接着对上提取的静态特征,得到数值类型特征后进行拼接,得到样本的特征向量;最后针对于各样本,基于消融实验和互信息法进行特征选择,挑选出最适合用于作者组织溯源分类的特征集合。通过本发明方法所确定出来的静态特征,对恶意软件作者组织进行溯源分类时,在检测的准确率、精确率、召回率、F1分数上都具有较好的效果,能够大大提高恶意软件作者组织分类的准确率。
-
公开(公告)号:CN114047929A
公开(公告)日:2022-02-15
申请号:CN202210029556.8
申请日:2022-01-12
Applicant: 广东省科技基础条件平台中心 , 暨南大学
Abstract: 本发明公开了一种基于知识增强的用户定义函数识别方法、装置及介质,包括:对用户定义函数的反汇编文本进行预处理和划分处理,获得训练数据集;对其操作码进行词嵌入,生成词向量;将词向量输入Transformer模型,获取经过初始预训练过的Transformer模型;对预设数量阈值的词向量进行遮罩处理;将所有词向量输入到经过初始预训练过的Transformer模型,输出词向量的编码结果并将其作为反汇编文本的编码特征信息,将统计特征转换为三通道的图像以获取反汇编文本的统计特征信息,并将统计特征信息和编码特征信息进行拼接,输入全连接神经网络中,得到用户定义函数分类模型。本发明实施例能够准确识别用户定义函数。
-
公开(公告)号:CN112001424A
公开(公告)日:2020-11-27
申请号:CN202010741391.8
申请日:2020-07-29
Applicant: 暨南大学
Abstract: 本发明公开了基于对抗训练的恶意软件开放集家族分类方法和装置,首先获取训练样本的特征图像;通过生成对抗网络、第一分类器网络和第二分类器网络组成联合训练网络,由训练样本对生成对抗网络、第一分类器网络和第二分类器网络进行联合训练,将最后训练完成的第二分类器,作为恶意软件开放集分类器;针对待分类的测试样本,获取测试样本的特征图像;将测试样本的特征图像输入到恶意软件开放集分类器中,由恶意软件开放集分类器得到测试样本的家族分类结果。本发明能够训练出准确率和稳定性高的恶意软件开放集分类器,该分类器能对开放环境下的恶意软件样本进行家族分类,即不仅能对属于训练集旧家族的样本进行正确分类,而且能区分新旧家族样本。
-
公开(公告)号:CN107832609A
公开(公告)日:2018-03-23
申请号:CN201710871649.4
申请日:2017-09-25
Applicant: 暨南大学
IPC: G06F21/56
CPC classification number: G06F21/562 , G06F2221/033
Abstract: 本发明公开了一种基于权限特征的Android恶意软件检测方法和系统,步骤:构建第一训练样本集和第二训练样本集,提取各训练样本第一权限特征向量,根据d值挑选出权限特征构造第一权限特征集合,生成第一训练样本集中各训练样本第二权限特征向量,并构建关联系数矩阵;将第一训练样本集中各训练样本关联矩阵求和输入PPR算法,得到第一权限特征集合中每种权限特征的权限值;根据第一权限特征集合生成测试样本权限特征向量,利用第一权限特征集合中每种权限特征的权限值计算出测试样本所申请的权限特征权重η,将η与判断因子进行比较,判断出测试样本是否为Android恶意软件;该方法大大提高了Android恶意软件的检测准确率。
-
-
-
-
-
-
-