-
公开(公告)号:CN116092102A
公开(公告)日:2023-05-09
申请号:CN202211714858.5
申请日:2022-12-27
Applicant: 国家计算机网络与信息安全管理中心 , 长城计算机软件与系统有限公司
IPC: G06V30/412 , G06V30/413 , G06V30/18 , G06V30/162 , G06V30/148 , G06V30/19 , G06V10/44 , G06V10/26 , G06V10/28 , G06V10/48 , G06V10/764 , G06V10/82 , G06N3/044 , G06N3/08
Abstract: 本发明公开了一种包含文本信息的结构图的处理方法,所述方法包括:基于包含文本信息的结构图的线段组成进行轮廓检测;根据检测出的轮廓拟合出几何多边形;基于所述结构图中文本框的特征条件,从所述几何多边形中过滤掉不符合所述特征条件的形状,得到边框。本发明能够从包含有文本信息的结构图中高效、准确地提取出边框。
-
公开(公告)号:CN110556114B
公开(公告)日:2022-06-17
申请号:CN201910684343.7
申请日:2019-07-26
Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学
IPC: G10L17/18 , G10L17/04 , H04M1/656 , H04M1/72454 , H04M1/72403
Abstract: 本发明公开了一种基于注意力机制的说话人识别方法及装置,包括如下步骤:采集多个被测试通话人的通话录音和测试通话人的通话录音;根据所述被测试通话人对应的通话录音,建立通话人语音库;采用基于注意力的神经网络对所述被测试通话人语音进行训练,获得训练模型;存储所述测试通话人的通话录音,获得录音文件;将所述录音文件采用所述训练模型识别所述被测试通话人是否目标通话人。通过采用基于注意力的神经网络对所述被测试通话人语音进行训练,获得训练模型,采用训练模型识别所述被测试通话人,确认了拨号码对应的主人的一致性,避免了由于通话人身份被仿冒带来的通信安全隐患,进一步提高了通话过程中的信息的安全性。
-
公开(公告)号:CN113077785A
公开(公告)日:2021-07-06
申请号:CN201911300918.7
申请日:2019-12-17
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明属于网络通信技术领域,具体涉及一种端到端的多语言连续语音流语音内容识别方法,该方法包括:将待识别的语音频谱特征输入至预先构建的基于深度神经网络的段级别语种分类模型,提取语句级别语种状态后验概率分布向量;将每一种语言种类的待识别的语音频谱特征序列和语句级别语种状态后验概率分布向量输入至预先构建的多语言语音识别模型,输出对应语言种类的语音识别结果。
-
公开(公告)号:CN110933667A
公开(公告)日:2020-03-27
申请号:CN201910991131.3
申请日:2019-10-18
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司 , 杭州东信北邮信息技术有限公司
Abstract: 一种可扩展的防范诈骗电话的系统与方法,系统包括:前端接入装置,接收并保存扩展管理装置发送的检测策略,同时解析核心网元接收的通话信令,将符合检测策略的通话信令以数据流方式加密后回传给扩展管理装置;扩展管理装置,向前端接入装置分配检测策略,根据前端接入装置发送来的信令流,选择对应的检测装置,然后将信令流解密后再转发给检测装置,最后根据检测装置返回的检测结果,向前端接入装置发送处置命令;检测装置,用于对扩展管理装置发送来的信令流进行检测,然后将检测结果回复给扩展管理装置。本发明属于信息技术领域,能满足运营商不断新增的防范需求和防范诈骗份子不断翻新的诈骗行为。
-
公开(公告)号:CN110856176A
公开(公告)日:2020-02-28
申请号:CN201910992035.0
申请日:2019-10-18
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04W12/12
Abstract: 一种采用流表方式实现的呼叫管理的系统及其方法,包括:前端接入装置,安装在IMS网络的业务服务器上,定期以流表方式上报服务器的能力数据到后端控制器,并接收后端控制器下发的流表策略数据;当接收到CSCF的呼叫信令时,根据流表策略数据,对服务器接收的呼叫信令进行检测和匹配,记录处置结果,然后将呼叫过程中的数据回传给后端控制器;后端控制器,接收并更新前端接入装置上报的流表数据,然后根据前端接入装置上报的能力数据,生成对应的流表策略数据,再将所述流表策略数据下发给前端接入装置;同时,接收并保存前端接入装置发来的呼叫过程数据。本发明属于信息技术领域,能基于各省移动网络运营商侧来构建共同的呼叫管理网络。
-
公开(公告)号:CN110266902A
公开(公告)日:2019-09-20
申请号:CN201910444314.3
申请日:2019-05-27
Applicant: 国家计算机网络与信息安全管理中心 , 南京中新赛克科技有限责任公司
Abstract: 本发明公开了一种VoIP信令与媒体数据关联系统、方法及计算机存储介质,系统包括识别过滤装置、解析处理装置、核心关联装置和数据分析反馈装置,方法上采用多维度数据对互联网VoIP网络电话协议信令与媒体数据进行关联。本发明从功能上,既保证了关联结果的高质量性,又保证关联结果的高数量性;从可靠性上,对关联结果的后续分析并将分析结果反馈给关联使用,逐步优化系统的关联效果;从可扩展性上,采用多装置处理的方式,使得需要拓展功能时,只需要修改或者扩展单装置功能而不影响整体的功能以及效果。
-
公开(公告)号:CN109920406A
公开(公告)日:2019-06-21
申请号:CN201910245435.5
申请日:2019-03-28
Applicant: 国家计算机网络与信息安全管理中心 , 珠海高凌信息科技股份有限公司
Abstract: 本发明的技术方案包括一种基于可变起始位置的动态语音识别方法及系统,用于实现:实时加载输入的语音流信号,对语音信号进行预处理;对语音信号进行特征提取,获取语音信号中的特征;根据语音信号中的特征调用语音模型信息库的多个模型对语音信号进行逐帧模式匹配。本发明的有益效果为:本发明的有益效果为容易理解,实现简单,当前语音模型匹配选取长度较为合理,经过算法改进后,减少了语音模型匹配次数,语音识别效率比之前的算法提高了30%的效率。
-
公开(公告)号:CN116702022A
公开(公告)日:2023-09-05
申请号:CN202310512618.5
申请日:2023-05-08
Applicant: 国家计算机网络与信息安全管理中心
Inventor: 李林 , 李美燕 , 王秀文 , 崔雨涵 , 陈鹏云 , 杨菁林 , 徐丹丹 , 秦韬 , 郭富民 , 刘志丞 , 李娅强 , 曾宣玮 , 张栋 , 王峰 , 李政达 , 李东明 , 秦恺
IPC: G06F18/241 , G06F18/23 , G06Q30/0601
Abstract: 本发明实施例涉及一种商品分类模型训练方法、装置、计算机设备及存储介质,该方法包括:根据特征提取模型提取商品集合中每个商品的第一特征,得到第一特征集合,所述第一特征用于表征所述商品的商品特征和所述商品对应的企业特征;对所述第一特征集合进行聚类处理,得到多个簇,每个所述簇中包含多个所述第一特征;从每个所述簇中提取多个目标第一特征,得到目标第一特征集合;根据所述目标第一特征集合对第一初始模型进行训练,得到训练好的商品分类模型。由此,可以实现通过商品特征和企业特征结合进行分类模型的训练,提高了分类的准确度,且对训练的特征进行了筛选,提高模型训练效率。
-
公开(公告)号:CN113742478B
公开(公告)日:2023-09-05
申请号:CN202010474192.5
申请日:2020-05-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/33 , G06F40/295 , G06N3/0464
Abstract: 本发明公开了一种针对海量文本数据的定向筛选架构及方法。本方法步骤包括:1)使用关键词匹配方法从待筛选文本中获取疑似目标文本;2)从已标注的目标文本中提取常用句式,并分为与业务强相关句式、与业务弱相关句式;对待筛选文本进行模糊句式匹配,如果与业务强相关句式匹配,则将文本判断为目标文本,否则为疑似目标文本;3)对每一疑似目标文本进行分类;4)根据疑似目标文本匹配上的关键词的个数确定文本的评估值E1;根据分类判别结果,确定文本的评估值E2;基于文本与外部辅助语料的信息匹配结果确定文本的评估值E3;然后基于评估值E1~E3,计算得到文本最终评分反馈给研判层;5)研判层确定反馈的文本是否为目标文本。
-
公开(公告)号:CN115827871A
公开(公告)日:2023-03-21
申请号:CN202211690035.3
申请日:2022-12-27
Applicant: 国家计算机网络与信息安全管理中心 , 长城计算机软件与系统有限公司
IPC: G06F16/35 , G06N3/08 , G06F18/241 , G06N3/0464
Abstract: 本发明提供了一种互联网企业分类的方法和装置,其中该方法包括:S1:获取互联网企业的多维度数据,并对所述多维度数据预处理以生成长文本数据;S2:将所述长文本数据输入基于Transformer编码器的Bert网络模型进行处理;S3:将经过处理后的数据送入分类器来对所述互联网企业进行分类。本发明的方案基于在Transformer架构的深度神经网络中进行自动特征组合学习,能够对互联网企业准确进行行业分类,并能够极大提升互联网企业行业分类的准确率。本发明的方案能够快速将海量企业多维度信息进行识别,无需人工干预。本发明的方案基于大语料预训练模型加下游任务微调的方案能灵活应用在不同场景中海量企业的快速分类。
-
-
-
-
-
-
-
-
-