-
公开(公告)号:CN117609492A
公开(公告)日:2024-02-27
申请号:CN202310707147.3
申请日:2023-06-14
Applicant: 北京理工大学
IPC: G06F16/35 , G06F18/2431 , G06F40/30 , G06N3/045 , G06F40/237
Abstract: 本发明属于信息安全技术领域,具体涉及一种基于API核心语义信息的轻量级恶意代码分类方法。本发明主要用于恶意代码多分类任务,以API调用序列为研究对象,然后借助于最先进的自然语言处理领域的文本分类相关技术实现恶意代码的分类,主要包括数据预处理、注意力机制、亲密度分析、关键信息提取、词嵌入矩阵分解、特征提取及分类等步骤。本发明优化了数据预处理过程,加入一种基于注意力机制的关键信息提取过程,有效的二次减少了序列长度。本文使用了一定的词嵌入分解技术和参数共享机制,减小了检测过程中的资源消耗,大幅地提高了检测速度。解决了传统检测方法中语义信息提取不足、模型高开销的缺点。