-
公开(公告)号:CN114090775A
公开(公告)日:2022-02-25
申请号:CN202111376161.7
申请日:2021-11-19
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 天津市国瑞数码安全系统股份有限公司
Inventor: 周小敏 , 应鸿晖 , 林国池 , 石易 , 麦丽娟 , 莫凡 , 林佳涛 , 李高翔 , 黄福鸿 , 卓采标 , 廖淑敏 , 杨慧强 , 宋宜昌 , 黄正国 , 周毅 , 吴冠标 , 李新 , 蒋维 , 曹勇 , 高欢
IPC: G06F16/35 , G06F16/33 , G06F16/951 , G06F16/957
Abstract: 本发明属于网页文本处理领域,具体涉及一种基于BERT算法的网页有害文本识别方法及系统,所述识别方法包括:步骤1:使用网络爬虫爬取网页原始内容,得到初始文本;步骤2:基于HTML协议对初始文本进行文本整理,得到待识别文本集合;步骤3:将待识别文本集合输入到基于BERT中文预训练模型训练得到的有害信息识别模型中进行有害文本识别,得到识别结果;步骤4:对识别结果进行人工验证,并基于得到的异常识别样本更新有害信息识别模型。上述方法不仅准确提取有效的网页文本,利用已有的有害文本判断模型实现网页文本内容识别,同时还通过人工校正对有害文本判断模型进行训练更新,进一步提升有害文本判断模型的准确性。
-
公开(公告)号:CN114143290B
公开(公告)日:2024-01-30
申请号:CN202111407941.3
申请日:2021-11-19
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 天津市国瑞数码安全系统股份有限公司
Inventor: 周小敏 , 应鸿晖 , 林国池 , 石易 , 麦丽娟 , 莫凡 , 林佳涛 , 黄福鸿 , 李高翔 , 卓采标 , 杨慧强 , 廖淑敏 , 宋宜昌 , 周毅 , 黄正国 , 吴冠标 , 李新 , 蒋维 , 曹勇 , 高欢
IPC: H04L61/5061 , H04L61/5007 , H04L61/5053 , H04L67/56 , G06F16/951
Abstract: 本发明属于IP代理技术领域,具体涉及一种多网站并行爬取的IP代理池的构建系统和方法,所述构建系统包括:IP验证模块,用于对初始IP集合内的代理IP进行代理可用性验证,并将可用的代理IP置入有效队列中,得到有效IP集合;IP标记模块,用于对有效IP集合内的代理IP进行逐一标记,得到具有标记信息的标记IP集合;IP组合模块,用于获取若干待爬取网站信息并为每个待爬取网站构建对应的网站代理IP队列,还用于基于待爬取网站信息在标记IP集合中挑取标记信息与其匹配的代理IP,并将挑取的代理IP置入与其匹配的网站代理IP队列中。上述构建系统构建了多网站并行爬取代理池,实现了多网站并行爬取,进而提高代理IP的利用率以及爬取成功率。
-
公开(公告)号:CN114143290A
公开(公告)日:2022-03-04
申请号:CN202111407941.3
申请日:2021-11-19
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 天津市国瑞数码安全系统股份有限公司
Inventor: 周小敏 , 应鸿晖 , 林国池 , 石易 , 麦丽娟 , 莫凡 , 林佳涛 , 黄福鸿 , 李高翔 , 卓采标 , 杨慧强 , 廖淑敏 , 宋宜昌 , 周毅 , 黄正国 , 吴冠标 , 李新 , 蒋维 , 曹勇 , 高欢
IPC: H04L61/5061 , H04L61/5007 , H04L61/5053 , H04L67/56 , G06F16/951
Abstract: 本发明属于IP代理技术领域,具体涉及一种多网站并行爬取的IP代理池的构建系统和方法,所述构建系统包括:IP验证模块,用于对初始IP集合内的代理IP进行代理可用性验证,并将可用的代理IP置入有效队列中,得到有效IP集合;IP标记模块,用于对有效IP集合内的代理IP进行逐一标记,得到具有标记信息的标记IP集合;IP组合模块,用于获取若干待爬取网站信息并为每个待爬取网站构建对应的网站代理IP队列,还用于基于待爬取网站信息在标记IP集合中挑取标记信息与其匹配的代理IP,并将挑取的代理IP置入与其匹配的网站代理IP队列中。上述构建系统构建了多网站并行爬取代理池,实现了多网站并行爬取,进而提高代理IP的利用率以及爬取成功率。
-
公开(公告)号:CN109816404B
公开(公告)日:2023-04-07
申请号:CN201910082358.6
申请日:2019-01-28
Applicant: 天津市国瑞数码安全系统股份有限公司
IPC: G06Q30/01 , G06Q50/30 , G06F18/2321 , H04W12/12
Abstract: 本发明涉及一种基于DBSCAN算法的电信诈骗团伙聚类方法及电信诈骗团伙聚类系统,该方法包括:获取可疑通讯数据;分析可疑通讯数据中的被叫用户数据,以获取与被叫用户数据对应的主叫用户数据;将收集的各主叫用户数据作为电信网络节点,在预定区域内形成电信网络节点集;判断该预定区域内的各电信网络节点是否为核心点,以找出预定区域内的所有核心点;根据各核心点找出预定区域内的边界点和噪声点;删除噪声点,并根据预定区域内的所有核心点和边界点形成电信诈骗团伙簇。本发明基于DBSCAN算法,能够发现以任意形状存在的电信诈骗团伙类簇,能够对整个电信诈骗团伙一次性根除,实现实时有效的欺诈预警和低成本的治理。
-
公开(公告)号:CN111666308A
公开(公告)日:2020-09-15
申请号:CN202010493243.9
申请日:2020-06-03
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
IPC: G06F16/2457
Abstract: 本发明提供一种基于行为分析的大数据智能推荐查询方法,所述方法包括如下步骤:S1:从用户日志系统中提取用户的数据查询记录;S2:根据步骤S1中取得的所述数据查询记录进行热点数据分析;S3:根据步骤S2中得到的热点数据分析结果构建查询模型。本发明提供了一种方法通过对用户行为分析技术,有效发现不同业务用户的数据热度,根据用户的行为习惯进行提前推荐数据,实现数据高速查询。
-
公开(公告)号:CN110267272A
公开(公告)日:2019-09-20
申请号:CN201910572213.4
申请日:2019-06-28
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明涉及一种诈骗短信识别方法及识别系统,该方法包括:收集多条历史诈骗短信的相关数据,并从每条历史诈骗短信的相关数据提取历史诈骗短信的特征向量和诈骗类别;根据历史诈骗短信的特征向量和诈骗类别进行诈骗短信模型训练,获取诈骗短信判断模型;接收新短信的相关数据,并从每条新短信的相关数据中提取新短信的特征向量;将新短信的特征向量输入诈骗短信判断模型中,获取新短信是否属于诈骗短信以及属于哪种诈骗类别。本发明收集并根据多条历史诈骗短信的相关数据获取诈骗短信判断模型,该诈骗短信判断模型基于历史诈骗短信的相关数据,不限于短信内容,使得诈骗短信判断模型能够从多方面综合判断新短信是否属于诈骗短信以及哪种诈骗短信。
-
公开(公告)号:CN108156334A
公开(公告)日:2018-06-12
申请号:CN201810100161.6
申请日:2018-02-01
Applicant: 天津市国瑞数码安全系统股份有限公司
CPC classification number: H04M3/2281 , H04M2203/6027 , H04W12/12
Abstract: 本发明公开了一种基于互联网获得诈骗场景的控制系统,包括数据源,用于提供原始日志数据;数据加载模块,和数据源相连,用于获取和预处理原始日志数据;数据存储模块,用于存储原始日志数据和预处理后的中间结果数据;综合分析模块,在综合分析模块内设有诈骗场景分析模块,诈骗场景分析模块和数据存储模块相连;应用模块,和数据存储模块相连。本发明通过对多维数据进行大量分析及效果验证,更准确、快速的发现团伙作案的成员、团伙在实施诈骗时所属的角色以及团伙的分布情况等,为防范业务用户提供最新的诈骗行为动态,及时调整防范策略,也为公安机构打击诈骗及立案侦查提供重要依据。
-
公开(公告)号:CN115314265B
公开(公告)日:2023-07-18
申请号:CN202210890822.6
申请日:2022-07-27
Applicant: 天津市国瑞数码安全系统股份有限公司
IPC: H04L9/40 , G06F18/241 , G06N3/006
Abstract: 本发明提供一种基于流量和时序识别TLS加密应用的方法和系统,通过根据客户端发送的流量数据是否携带业务载荷或携带的握手信息是否完整,可以快速筛查出恶意代码;通过提取出流量数据的时序特征和空间特征,进行随机森林分类,可以全方面检测并快速突出所需的特征向量,利用整合的不同的分类能力,克服了现有技术恶意代码借用加密流量规避基于端口或载荷关键词的入侵检测,以及需要在新加密协议TLS1.3一次往返过程中完成识别检测的问题。
-
公开(公告)号:CN115314265A
公开(公告)日:2022-11-08
申请号:CN202210890822.6
申请日:2022-07-27
Applicant: 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明提供一种基于流量和时序识别TLS加密应用的方法和系统,通过根据客户端发送的流量数据是否携带业务载荷或携带的握手信息是否完整,可以快速筛查出恶意代码;通过提取出流量数据的时序特征和空间特征,进行随机森林分类,可以全方面检测并快速突出所需的特征向量,利用整合的不同的分类能力,克服了现有技术恶意代码借用加密流量规避基于端口或载荷关键词的入侵检测,以及需要在新加密协议TLS1.3一次往返过程中完成识别检测的问题。
-
公开(公告)号:CN114500744A
公开(公告)日:2022-05-13
申请号:CN202210116464.3
申请日:2022-02-07
Applicant: 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明涉及一种诈骗电话和骚扰电话分析取证方法及系统,包括:获取用户通话话单数据进行筛选得到初始通话数据;利用所述初始通话数据得到有害分类号码数据;利用所述有害分类号码数据获取数据分析预警结果;其中,所述初始通话数据为初始主叫通话数据与初始被叫通话数据,为有效适应网络演进的发展,提升诈骗、骚扰电话治理的灵活性和时效性,亟需建立诈骗电话和骚扰电话的分析取证系统,实现有害电话的精准发现,为有害号码处置提供依据。
-
-
-
-
-
-
-
-
-