-
公开(公告)号:CN117591119B
公开(公告)日:2024-05-31
申请号:CN202311441226.0
申请日:2023-11-01
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及软件检测技术领域,公开了一种海量APK源码特征提取及相似分析方法,首先输入两个APK文件,通过源码解析反编译方法提取到APK包的AndroidManifest文件、本地化语言配置文件,提取到SMALI或JAVA源代码;再通过包名索引、启动类索引、固定目录识别方式,识别APK核心源码目录、第三方包目录、系统资源目录,并生成源码树;再对核心源码目录中的文件进行分析,计算文件HASH,提取源码文件中字符串类声明特征表示作为加权特征;计算拟进行分析的两棵源码树结构的相似度情况,根据源码目录的类型对进行不同程度的相似度加权。本发明降低分析资源投入和时间消耗,提升源码相似分析的准确度,能够实现在大规模APK数据分析场景的高性能分析。
-
公开(公告)号:CN118277914B
公开(公告)日:2025-01-24
申请号:CN202311471891.4
申请日:2023-11-07
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/2431 , G06F18/24 , G06F18/213 , G06F18/22
Abstract: 本发明涉及APP分类分析技术领域,公开了一种基于动静结合多维度APK特征的移动应用分类方法,首先进行APP特征构建,基于主流手机应用商店、互联网小型分发平台、APP传播页面对APP的信息进行采集,具体通过APP所提供的功能或呈现的信息内容,识别APP的业务分类,采集通信类的信息,形成初始的测试数据集;再基于APP源码进行分析,获取APP的静态源码特征、动态流量和页面特征数据,具体包括名称、流量和内容信息;进行建立规则匹配模型和匹配机制,具体通过构建定时扫描程序,通过预设的各分类规则匹配模型进行识别和研判。本发明对具有显著技术特征或内容特征的APP具有较高的识别准确率,降低人工审核参与度。
-
公开(公告)号:CN117591119A
公开(公告)日:2024-02-23
申请号:CN202311441226.0
申请日:2023-11-01
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及软件检测技术领域,公开了一种海量APK源码特征提取及相似分析方法,首先输入两个APK文件,通过源码解析反编译方法提取到APK包的AndroidManifest文件、本地化语言配置文件,提取到SMALI或JAVA源代码;再通过包名索引、启动类索引、固定目录识别方式,识别APK核心源码目录、第三方包目录、系统资源目录,并生成源码树;再对核心源码目录中的文件进行分析,计算文件HASH,提取源码文件中字符串类声明特征表示作为加权特征;计算拟进行分析的两棵源码树结构的相似度情况,根据源码目录的类型对进行不同程度的相似度加权。本发明降低分析资源投入和时间消耗,提升源码相似分析的准确度,能够实现在大规模APK数据分析场景的高性能分析。
-
公开(公告)号:CN118796264A
公开(公告)日:2024-10-18
申请号:CN202410768709.X
申请日:2024-06-14
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及模板网站发现技术领域,公开了一种模板网站关键源码片段识别方法,包括基于PC端/移动端两种UserAgent获取网站的页面源代码,并且获取到图片、文件等外链资源;获取到完整的网页源码信息后,通过构建源码文件和源码片段的提取规则,获取到HTML、JS、CSS、IMG片段或文件;基于人工分析并形成评价源码相关性和通用性的指标体系,通过人工标注一批正样本和负样本;基于机器学习模型进行训练,形成网站关键源码片段研判模型;通过模型对实时源码片段数据进行分析,并输出研判结果。本发明通过构建网站相关性和通用性维度指标体系,基于机器学习模型提取网站的关键源码片段。基于该识别结果能够在不掌握大量样本的情况下,支撑对大量网站和源码进行快速匹配识别模板网站,大大提高了识别效率降低算力消耗。
-
公开(公告)号:CN118277914A
公开(公告)日:2024-07-02
申请号:CN202311471891.4
申请日:2023-11-07
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/2431 , G06F18/24 , G06F18/213 , G06F18/22
Abstract: 本发明涉及APP分类分析技术领域,公开了一种基于动静结合多维度APK特征的移动应用分类方法,首先进行APP特征构建,基于主流手机应用商店、互联网小型分发平台、APP传播页面对APP的信息进行采集,具体通过APP所提供的功能或呈现的信息内容,识别APP的业务分类,采集通信类的信息,形成初始的测试数据集;再基于APP源码进行分析,获取APP的静态源码特征、动态流量和页面特征数据,具体包括名称、流量和内容信息;进行建立规则匹配模型和匹配机制,具体通过构建定时扫描程序,通过预设的各分类规则匹配模型进行识别和研判。本发明对具有显著技术特征或内容特征的APP具有较高的识别准确率,降低人工审核参与度。
-
-
-
-