统一资源定位符去重方法及装置
Abstract:
本发明提出一种统一资源定位符去重方法及装置,其统一资源定位符去重方法包括:根据统一资源定位符的结构预设去重规则库;从网站访问数据中获取要去重的统一资源定位符数据;根据统一资源定位符的结构和分段参数,将所述要去重的统一资源定位符与所述去重规则库中的去重规则进行匹配;以及将匹配出的与相同去重规则对应的统一资源定位符进行过滤,并对应每个去重规则保留一个统一资源定位符。通过本发明实施例的方法及装置,可以通过去重规则对海量URL数据进行过滤去重,避免在URL安全漏洞检测时,安全漏洞扫描器重复的扫描同一个CGI,从而提高安全漏洞的检测效率。
Public/Granted literature
Patent Agency Ranking
0/0