-
公开(公告)号:CN106022126A
公开(公告)日:2016-10-12
申请号:CN201610297843.1
申请日:2016-05-06
Applicant: 哈尔滨工程大学
CPC classification number: G06F21/563 , G06F17/30887
Abstract: 本发明提供的是一种面向WEB木马检测的网页特征提取方法。包含数据获取、页面解析、脚本解析和特征提取四个阶段。数据获取阶段包括:数据包在网关处的获取以及记录存取该数据包方法。页面解析阶段:利用正则匹配方式获取网页标签以及链接。脚本解析阶段:对网页中的脚本利用脚本解析引擎以及对其的改进获取脚本中相应的链接及函数关系。特征提取阶段:统计页面标签特征,并计算重定向链中存在的特征。本发明的方法提取有效的标签元素信息,获取重定向链接特征以及相应的页面特征,省略不必要的元素审查。具有较高的建模效率。该模型在提取过程中采用正则匹配以及脚本引擎方式,具有较高的提取速度。可以在浏览器以及网关处都能发挥其重要作用。
-
公开(公告)号:CN106022126B
公开(公告)日:2018-07-24
申请号:CN201610297843.1
申请日:2016-05-06
Applicant: 哈尔滨工程大学
Abstract: 本发明提供的是一种面向WEB木马检测的网页特征提取方法。包含数据获取、页面解析、脚本解析和特征提取四个阶段。数据获取阶段包括:数据包在网关处的获取以及记录存取该数据包方法。页面解析阶段:利用正则匹配方式获取网页标签以及链接。脚本解析阶段:对网页中的脚本利用脚本解析引擎以及对其的改进获取脚本中相应的链接及函数关系。特征提取阶段:统计页面标签特征,并计算重定向链中存在的特征。本发明的方法提取有效的标签元素信息,获取重定向链接特征以及相应的页面特征,省略不必要的元素审查。具有较高的建模效率。该模型在提取过程中采用正则匹配以及脚本引擎方式,具有较高的提取速度。可以在浏览器以及网关处都能发挥其重要作用。
-