-
公开(公告)号:CN114090775A
公开(公告)日:2022-02-25
申请号:CN202111376161.7
申请日:2021-11-19
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 天津市国瑞数码安全系统股份有限公司
Inventor: 周小敏 , 应鸿晖 , 林国池 , 石易 , 麦丽娟 , 莫凡 , 林佳涛 , 李高翔 , 黄福鸿 , 卓采标 , 廖淑敏 , 杨慧强 , 宋宜昌 , 黄正国 , 周毅 , 吴冠标 , 李新 , 蒋维 , 曹勇 , 高欢
IPC: G06F16/35 , G06F16/33 , G06F16/951 , G06F16/957
Abstract: 本发明属于网页文本处理领域,具体涉及一种基于BERT算法的网页有害文本识别方法及系统,所述识别方法包括:步骤1:使用网络爬虫爬取网页原始内容,得到初始文本;步骤2:基于HTML协议对初始文本进行文本整理,得到待识别文本集合;步骤3:将待识别文本集合输入到基于BERT中文预训练模型训练得到的有害信息识别模型中进行有害文本识别,得到识别结果;步骤4:对识别结果进行人工验证,并基于得到的异常识别样本更新有害信息识别模型。上述方法不仅准确提取有效的网页文本,利用已有的有害文本判断模型实现网页文本内容识别,同时还通过人工校正对有害文本判断模型进行训练更新,进一步提升有害文本判断模型的准确性。
-
公开(公告)号:CN114143290B
公开(公告)日:2024-01-30
申请号:CN202111407941.3
申请日:2021-11-19
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 天津市国瑞数码安全系统股份有限公司
Inventor: 周小敏 , 应鸿晖 , 林国池 , 石易 , 麦丽娟 , 莫凡 , 林佳涛 , 黄福鸿 , 李高翔 , 卓采标 , 杨慧强 , 廖淑敏 , 宋宜昌 , 周毅 , 黄正国 , 吴冠标 , 李新 , 蒋维 , 曹勇 , 高欢
IPC: H04L61/5061 , H04L61/5007 , H04L61/5053 , H04L67/56 , G06F16/951
Abstract: 本发明属于IP代理技术领域,具体涉及一种多网站并行爬取的IP代理池的构建系统和方法,所述构建系统包括:IP验证模块,用于对初始IP集合内的代理IP进行代理可用性验证,并将可用的代理IP置入有效队列中,得到有效IP集合;IP标记模块,用于对有效IP集合内的代理IP进行逐一标记,得到具有标记信息的标记IP集合;IP组合模块,用于获取若干待爬取网站信息并为每个待爬取网站构建对应的网站代理IP队列,还用于基于待爬取网站信息在标记IP集合中挑取标记信息与其匹配的代理IP,并将挑取的代理IP置入与其匹配的网站代理IP队列中。上述构建系统构建了多网站并行爬取代理池,实现了多网站并行爬取,进而提高代理IP的利用率以及爬取成功率。
-
公开(公告)号:CN114143290A
公开(公告)日:2022-03-04
申请号:CN202111407941.3
申请日:2021-11-19
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 天津市国瑞数码安全系统股份有限公司
Inventor: 周小敏 , 应鸿晖 , 林国池 , 石易 , 麦丽娟 , 莫凡 , 林佳涛 , 黄福鸿 , 李高翔 , 卓采标 , 杨慧强 , 廖淑敏 , 宋宜昌 , 周毅 , 黄正国 , 吴冠标 , 李新 , 蒋维 , 曹勇 , 高欢
IPC: H04L61/5061 , H04L61/5007 , H04L61/5053 , H04L67/56 , G06F16/951
Abstract: 本发明属于IP代理技术领域,具体涉及一种多网站并行爬取的IP代理池的构建系统和方法,所述构建系统包括:IP验证模块,用于对初始IP集合内的代理IP进行代理可用性验证,并将可用的代理IP置入有效队列中,得到有效IP集合;IP标记模块,用于对有效IP集合内的代理IP进行逐一标记,得到具有标记信息的标记IP集合;IP组合模块,用于获取若干待爬取网站信息并为每个待爬取网站构建对应的网站代理IP队列,还用于基于待爬取网站信息在标记IP集合中挑取标记信息与其匹配的代理IP,并将挑取的代理IP置入与其匹配的网站代理IP队列中。上述构建系统构建了多网站并行爬取代理池,实现了多网站并行爬取,进而提高代理IP的利用率以及爬取成功率。
-
公开(公告)号:CN108156336A
公开(公告)日:2018-06-12
申请号:CN201810100162.0
申请日:2018-02-01
Applicant: 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明公开了一种基于多特征加权模型分析话单号码的控制系统,包括数据源;号码特征分析模块,与数据源相连,号码特征分析模块用于分析主被叫号码的行为特征,并得到号码行为特征话单;诈骗主叫分析模块,与号码特征分析模块、数据源相连,在诈骗主叫分析模块内设有多特征加权模型模块,多特征加权模型模块包括属性特征分析模块、行为特征分析模块、诈骗场景分析模块;易感被叫分析模块,与诈骗主叫分析模块、数据源相连。本发明围绕诈骗场景、号码行为特征、号码属性特征进行多特征加权模型分析,对涉诈场景的主被叫进行分析定性,改善了现有的单一话务特征判断,提高了数据的准确性和可行性。
-
公开(公告)号:CN108156335A
公开(公告)日:2018-06-12
申请号:CN201810108308.6
申请日:2018-02-02
Applicant: 天津市国瑞数码安全系统股份有限公司
CPC classification number: H04M3/2281 , H04M2203/6027 , H04W12/12
Abstract: 本发明公开了一种诈骗信息码谱分析系统,包括数据源,用于提供原始日志数据;数据加载模块,和数据源相连,用于获取和预处理原始日志数据;数据存储模块,用于存储原始日志数据和预处理后的中间结果数据;综合分析模块,和数据存储模块相连,用于对原始日志数据进行多维度综合分析,在综合分析模块内设有分布式计算模块;应用模块,和数据存储模块相连,用于对分析结果进行展示。本发明运用大数据分析的手段从海量的电信网通话详细日志、反诈系统基础数据、电路域日志、短信、彩信和互联网日志等多维度的行为数据中挖掘分析,深度剖析诈骗份子的行为特点和诈骗场景,分析受害人群,为通讯信息诈骗综合防范提供技术和数据支撑。
-
公开(公告)号:CN108156333A
公开(公告)日:2018-06-12
申请号:CN201810100126.4
申请日:2018-02-01
Applicant: 天津市国瑞数码安全系统股份有限公司
CPC classification number: H04M3/2281 , H04M2203/6027 , H04W12/12
Abstract: 本发明公开了一种防止诈骗的控制系统,包括数据源,用于提供原始日志数据;数据加载模块,和数据源相连,用于获取和预处理原始日志数据;数据存储模块,用于存储原始日志数据和预处理后的中间结果数据;综合分析模块,和数据存储模块相连,在综合分析模块内设有诈骗群体分析模块;应用模块,和数据存储模块相连。本发明运用大数据分析的手段从海量的电信网通话详细日志、反诈系统基础数据、电路域日志、短信、彩信和互联网日志等多维度的行为数据中挖掘分析,深度剖析诈骗群体实施诈骗的行为特征和规律,为防范业务用户提供最新的诈骗行为动态,及时调整防范策略,也为公安机构打击诈骗及立案侦查提供重要依据。
-
公开(公告)号:CN108133061A
公开(公告)日:2018-06-08
申请号:CN201810100150.8
申请日:2018-02-01
Applicant: 天津市国瑞数码安全系统股份有限公司
IPC: G06F17/30
CPC classification number: G06F16/1734 , G06F16/2264 , G06F16/2471
Abstract: 本发明公开了一种诈骗群体识别系统,包括数据源,用于提供原始日志数据;数据加载模块,和数据源相连,用于获取和预处理原始日志数据;数据存储模块,用于存储原始日志数据和预处理后的中间结果数据;综合分析模块,在综合分析模块内设有诈骗群体识别模块,诈骗群体识别模块和数据存储模块相连,诈骗群体识别模块用于识别诈骗团伙并将诈骗团伙信息存储在数据存储模块内;应用模块,和数据存储模块相连,用于对诈骗团伙信息进行展示。本发明通过对线上数据进行大量分析发现诈骗团伙,可以更全面的识别诈骗团伙,并能对今后可能出现的诈骗团伙进行识别。
-
公开(公告)号:CN109816404A
公开(公告)日:2019-05-28
申请号:CN201910082358.6
申请日:2019-01-28
Applicant: 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明涉及一种基于DBSCAN算法的电信诈骗团伙聚类方法及电信诈骗团伙聚类系统,该方法包括:获取可疑通讯数据;分析可疑通讯数据中的被叫用户数据,以获取与被叫用户数据对应的主叫用户数据;将收集的各主叫用户数据作为电信网络节点,在预定区域内形成电信网络节点集;判断该预定区域内的各电信网络节点是否为核心点,以找出预定区域内的所有核心点;根据各核心点找出预定区域内的边界点和噪声点;删除噪声点,并根据预定区域内的所有核心点和边界点形成电信诈骗团伙簇。本发明基于DBSCAN算法,能够发现以任意形状存在的电信诈骗团伙类簇,能够对整个电信诈骗团伙一次性根除,实现实时有效的欺诈预警和低成本的治理。
-
公开(公告)号:CN109347857A
公开(公告)日:2019-02-15
申请号:CN201811353191.4
申请日:2018-11-14
Applicant: 天津市国瑞数码安全系统股份有限公司
IPC: H04L29/06
CPC classification number: H04L63/0807 , H04L63/0876 , H04L63/10
Abstract: 本发明涉及信息安全领域,尤其涉及一种基于标识的通用跨网认证方法。该方法包括以下步骤:对用户身份信息进行验证;若验证通过,则根据用户身份信息生成用户标识信息分别发送至用户和对端网络;利用标识密钥管理装置根据用户标识信息生成用户标识密钥,并将用户标识密钥中的私钥发送给用户;对端网络接收用户提交的带有用户标识信息的跨网访问请求,并对用户标识信息进行验证,若验证通过,则向用户提供与跨网访问请求相对应的访问资源;其中,本网与对端网络之间采取网络隔离传输的方式进行通信。本发明的方法中,用户通过标识信息能够方便的进行跨网访问,解决了多个网之间用户跨网认证的问题,具有安全方便的优点。
-
公开(公告)号:CN109274694A
公开(公告)日:2019-01-25
申请号:CN201811353891.3
申请日:2018-11-14
Applicant: 天津市国瑞数码安全系统股份有限公司
CPC classification number: H04L63/0807 , H04L9/3066 , H04L9/3236 , H04L63/08
Abstract: 本发明涉及信息安全领域,尤其涉及一种基于标识的通用跨域认证方法。该方法包括以下步骤:接收本域中用户提交的带有用户身份信息的标识申请,并对用户身份信息进行验证;若验证通过,则根据用户身份信息生成用户标识信息分别发送至用户和被访问域;利用标识密钥管理装置根据用户标识信息生成用户标识密钥,并将用户标识密钥中的私钥发送给用户;被访问域接收用户提交的带有用户标识信息的跨域访问请求,并对用户标识信息进行验证,若验证通过,则向用户提供与跨域访问请求相对应的访问资源。本发明的方法中,用户通过标识信息能够方便的进行跨域访问,解决了多个域之间用户跨域认证的问题,具有安全方便的优点。
-
-
-
-
-
-
-
-
-