一种基于主被动数据的互联网接入网站数量的计算方法

    公开(公告)号:CN108880883B

    公开(公告)日:2021-11-05

    申请号:CN201810618363.X

    申请日:2018-06-15

    Abstract: 本发明公开了一种基于主被动数据的互联网接入网站数量的计算方法,所述方法包括:被动采集全国及各省互联网网站报备数据信息和IP地址报备信息,获得全国及各省互联网网站备案的域名信息、IP地址分布库;被动采集全国及各省活跃域名信息,获得全国及各省采集到的活跃域名信息;主动分布式采集以上两种方式采集的域名对应的网站信息,获得网站连接状态、标题、首页静态数据、接入IP地址信息;基于以上三类数据,通过数学建模,分析出全国及各省互联网网站的数量。本发明公开的统计方法能够在很大程度上反应全国互联网网站的总体数量情况、各省互联网网站的总体数量情况、所占比重情况,以及总体变化情况,具有较好的应用前景。

    一种应用程序违法检测方法、装置、设备及存储介质

    公开(公告)号:CN113190835A

    公开(公告)日:2021-07-30

    申请号:CN202110157024.8

    申请日:2021-02-04

    Abstract: 本发明实施例提供了一种应用程序违法检测方法、装置、设备及存储介质,其中,该方法沙箱养殖设备,该设备中安装至少一套包含沙箱环境的操作系统,该方法包括:获取至少一种应用程序的安装包文件,基于安装包文件安装应用程序;其中,至少一种应用程序包括至少一种类型的应用程序,或者至少一种版本的应用程序;每间隔设定时间执行至少一种应用程序的动态运行任务,在执行应用程序动态运行任务过程中,获取应用程序的行为记录,并将行为记录进行存储;从行为记录中提取满足设定规则的行为记录;基于提取的行为记录判断应用程序是否违法,可以对多种应用程序进行违法检测,可以全面监控应用程序,可以更安全更稳定的实现检测。

    一种建立CDN厂家基础知识库的方法

    公开(公告)号:CN109165334A

    公开(公告)日:2019-01-08

    申请号:CN201811100278.0

    申请日:2018-09-20

    Abstract: 本发明公开了一种建立CDN厂商基础知识库的方法,该方法包括:通过爬虫,获得网站上所有CDN厂家信息;被动采集全国各个域名解析服务器的域名解析记录,获得所有的域名解析信息;针对所有的解析域名进行字典表比照、CNAME聚类、IP分散度判别等综合判定,获得CDN子网信息;针对CDN子网域名信息依据字典表关联、备案库查询、whois查询、人工判别等手段建立与CDN厂商的对应关系,并形成最终的CDN厂商的子网域名和加速节点IP地址基础知识库。本发明公开的方法能够较为全面地发现CDN厂商的加速节点,并建立CDN厂商子网域名、加速节点IP地址等基础知识库,从而为CDN业务的行业发展和有效管理提供一定的技术支撑。

    一种基于主被动数据的互联网接入网站数量的计算方法

    公开(公告)号:CN108880883A

    公开(公告)日:2018-11-23

    申请号:CN201810618363.X

    申请日:2018-06-15

    Abstract: 本发明公开了一种基于主被动数据的互联网接入网站数量的计算方法,所述方法包括:被动采集全国及各省互联网网站报备数据信息和IP地址报备信息,获得全国及各省互联网网站备案的域名信息、IP地址分布库;被动采集全国及各省活跃域名信息,获得全国及各省采集到的活跃域名信息;主动分布式采集以上两种方式采集的域名对应的网站信息,获得网站连接状态、标题、首页静态数据、接入IP地址信息;基于以上三类数据,通过数学建模,分析出全国及各省互联网网站的数量。本发明公开的统计方法能够在很大程度上反应全国互联网网站的总体数量情况、各省互联网网站的总体数量情况、所占比重情况,以及总体变化情况,具有较好的应用前景。

    基于多维特征的互联网网站综合分类方法

    公开(公告)号:CN108256104A

    公开(公告)日:2018-07-06

    申请号:CN201810112942.7

    申请日:2018-02-05

    Abstract: 本发明公开了一种基于多维特征的互联网网站综合分类方法,该方法包括:采集互联网网站域名信息,获得互联网网站的域名信息列表;基于每个域名信息,采用爬虫获取域名对应的互联网网站标题信息,获取互联网网站的标题信息列表;基于每个域名信息,采用爬虫获取域名对应的互联网网站首页信息,获取互联网网站的首页信息列表;基于每个域名信息,采用爬虫获取域名对应的互联网网站页面链接信息,获取互联网网站的链接信息列表;综合获取的上述各信息列表,通过信息关联和机器学习,判别网站所属行业属性并进行对应分类。本发明解决了现有技术中无法对网站进行精确归类的问题。

    一种建立CDN厂家基础知识库的方法

    公开(公告)号:CN109165334B

    公开(公告)日:2022-05-27

    申请号:CN201811100278.0

    申请日:2018-09-20

    Abstract: 本发明公开了一种建立CDN厂商基础知识库的方法,该方法包括:通过爬虫,获得网站上所有CDN厂家信息;被动采集全国各个域名解析服务器的域名解析记录,获得所有的域名解析信息;针对所有的解析域名进行字典表比照、CNAME聚类、IP分散度判别等综合判定,获得CDN子网信息;针对CDN子网域名信息依据字典表关联、备案库查询、whois查询、人工判别等手段建立与CDN厂商的对应关系,并形成最终的CDN厂商的子网域名和加速节点IP地址基础知识库。本发明公开的方法能够较为全面地发现CDN厂商的加速节点,并建立CDN厂商子网域名、加速节点IP地址等基础知识库,从而为CDN业务的行业发展和有效管理提供一定的技术支撑。

    一种恶意程序检测模型的更新方法、装置、设备及介质

    公开(公告)号:CN114168955A

    公开(公告)日:2022-03-11

    申请号:CN202111493492.9

    申请日:2021-12-08

    Abstract: 本发明实施例公开了一种恶意程序检测模型的更新方法、装置、设备及介质。其中,该方法包括:提取与目标恶意程序匹配的目标恶意程序特征,并将目标恶意程序特征与样本特征库进行匹配;样本特征库存储有恶意程序检测模型能够学习过的恶意程序特征;如果确定目标恶意程序特征未命中样本特征库中的样本特征,则控制恶意程序检测模型学习目标恶意程序特征;在确定恶意程序检测模型成功学习目标恶意程序特征时,将所述目标恶意程序特征加入至所述样本特征库中。解决了恶意样本因为升级换代、受到管控打击等原因更新快,特征变化太大,离线训练的模型失效较快的问题,提高了对未知的恶意程序样本的识别能力,避免了未知的恶意程序对人们财产造成的损失。

Patent Agency Ranking