-
公开(公告)号:CN110309382A
公开(公告)日:2019-10-08
申请号:CN201910520989.1
申请日:2019-06-17
Applicant: 暨南大学
IPC: G06F16/906 , G06F16/901
Abstract: 本发明公开了一种基于多维特征的移动应用同源性边聚类方法,步骤如下:构建以移动应用软件关系图,移动应用软件作为关系图的顶点,由移动应用软件的不同特征比较算法得出软件之间的n种多维特征相似性分数作为关系图的边,形成“边”集合;设置相似分数阈值和有效分数个数阈值,过滤出“有效边”集合;计算“有效边”两两之间的距离;设置邻域半径,找出所有“有效边”的邻域;设置邻域密度阈值,找出所有“核心边”,形成“核心边对象”集合;从“核心边对象”集合中任一“核心边”开始遍历,将其所有密度可达的“有效边”聚成簇,最后得到软件同源家族分类情况。本发明有效克服以往基于单一距离的聚类,更公平地将软件进行同源家族分类。
-
公开(公告)号:CN110210224B
公开(公告)日:2023-01-31
申请号:CN201910424145.7
申请日:2019-05-21
Applicant: 暨南大学
IPC: G06F21/56
Abstract: 本发明公开了一种基于描述熵的大数据移动软件相似性智能检测方法,包括以下步骤:获取移动软件路径,按照路径读取移动软件的文件;对移动软件的文件进行初步逆向工程反编译,获取每个移动软件的函数特征;通过函数特征中的描述熵,统计每个移动软件描述熵的分布;将每个移动软件描述熵进一步整合,通过整合后,移动软件之间的描述熵分布情况进行比较,进行相似性分数计算,得到移动软件之间的相似性分数;输出所有移动软件的相似性分数,得到移动软件相似性结果;本发明通过反编译获取移动软件源代码,获取函数压缩编码再获取描述熵,利用描述熵作为表示一个对象的信息量,用于移动软件的相似性检测,大大提高软件相似性智能计算速度。
-
公开(公告)号:CN110222507B
公开(公告)日:2023-07-07
申请号:CN201910424747.2
申请日:2019-05-21
Applicant: 暨南大学
IPC: G06F21/56
Abstract: 本发明公开了一种基于模糊哈希的恶意软件大数据智能学习识别方法,包括以下步骤,获取移动软件文件夹路径,根据文件夹路径读取移动软件;对每个移动软件进行反编译,获取移动软件的源代码;对移动软件的源代码进行预处理,即获取源代码特征值;通过源代码特征值,获取模糊哈希值集合和移动软件的每个文件中代码行数集合;再进行相似性分数计算和模糊哈希值与相似性分数的权值计算,移动软件之间进行相似性比较,获得比较结果,进而甄别移动恶意软件;本发明通过移动软件源代码获取移动软件每个文件对应的模糊哈希值,利用模糊哈希值计算相似性分数和权值,进而对移动软件区分,有效监测恶意移动软件并进行区别,让用户远离恶意软件,减少损失。
-
公开(公告)号:CN110222507A
公开(公告)日:2019-09-10
申请号:CN201910424747.2
申请日:2019-05-21
Applicant: 暨南大学
IPC: G06F21/56
Abstract: 本发明公开了一种基于模糊哈希的恶意软件大数据智能学习识别方法,包括以下步骤,获取移动软件文件夹路径,根据文件夹路径读取移动软件;对每个移动软件进行反编译,获取移动软件的源代码;对移动软件的源代码进行预处理,即获取源代码特征值;通过源代码特征值,获取模糊哈希值集合和移动软件的每个文件中代码行数集合;再进行相似性分数计算和模糊哈希值与相似性分数的权值计算,移动软件之间进行相似性比较,获得比较结果,进而甄别移动恶意软件;本发明通过移动软件源代码获取移动软件每个文件对应的模糊哈希值,利用模糊哈希值计算相似性分数和权值,进而对移动软件区分,有效监测恶意移动软件并进行区别,让用户远离恶意软件,减少损失。
-
公开(公告)号:CN110309382B
公开(公告)日:2021-05-28
申请号:CN201910520989.1
申请日:2019-06-17
Applicant: 暨南大学
IPC: G06F16/906 , G06F16/901
Abstract: 本发明公开了一种基于多维特征的移动应用同源性边聚类方法,步骤如下:构建以移动应用软件关系图,移动应用软件作为关系图的顶点,由移动应用软件的不同特征比较算法得出软件之间的n种多维特征相似性分数作为关系图的边,形成“边”集合;设置相似分数阈值和有效分数个数阈值,过滤出“有效边”集合;计算“有效边”两两之间的距离;设置邻域半径,找出所有“有效边”的邻域;设置邻域密度阈值,找出所有“核心边”,形成“核心边对象”集合;从“核心边对象”集合中任一“核心边”开始遍历,将其所有密度可达的“有效边”聚成簇,最后得到软件同源家族分类情况。本发明有效克服以往基于单一距离的聚类,更公平地将软件进行同源家族分类。
-
公开(公告)号:CN110210224A
公开(公告)日:2019-09-06
申请号:CN201910424145.7
申请日:2019-05-21
Applicant: 暨南大学
IPC: G06F21/56
Abstract: 本发明公开了一种基于描述熵的大数据移动软件相似性智能检测方法,包括以下步骤:获取移动软件路径,按照路径读取移动软件的文件;对移动软件的文件进行初步逆向工程反编译,获取每个移动软件的函数特征;通过函数特征中的描述熵,统计每个移动软件描述熵的分布;将每个移动软件描述熵进一步整合,通过整合后,移动软件之间的描述熵分布情况进行比较,进行相似性分数计算,得到移动软件之间的相似性分数;输出所有移动软件的相似性分数,得到移动软件相似性结果;本发明通过反编译获取移动软件源代码,获取函数压缩编码再获取描述熵,利用描述熵作为表示一个对象的信息量,用于移动软件的相似性检测,大大提高软件相似性智能计算速度。
-
-
-
-
-