-
公开(公告)号:CN110942783B
公开(公告)日:2022-06-17
申请号:CN201910978660.X
申请日:2019-10-15
Applicant: 国家计算机网络与信息安全管理中心 , 珠海高凌信息科技股份有限公司
Abstract: 本发明涉及一种基于音频多级聚类的群呼型骚扰电话分类方法,该方法包括:S100,将包括有多个音频数据的音频池划分为多个等同分组,将每个分组依次进行特征提取及特征对比,进而执行聚类分析,得到音频聚类;S200,将音频进行语音转写,将语音转写的文本进行关键词库检索对比,得到关键词对比结果;S300,将音频聚类执行音频库检索对比,得到音频聚类结果;S400,对所述关键词对比结果及音频聚类结果进行合并分析,得到自动分类的群呼型骚扰电话。本发明的有益效果为:能够有效检测和发现群呼型骚扰电话;结合关键词、文本转写等手段,对骚扰电话实现了自动分类,节省了人工成本,提高了效率。
-
公开(公告)号:CN113742478A
公开(公告)日:2021-12-03
申请号:CN202010474192.5
申请日:2020-05-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/33 , G06F40/295 , G06N3/04
Abstract: 本发明公开了一种针对海量文本数据的定向筛选架构及方法。本方法步骤包括:1)使用关键词匹配方法从待筛选文本中获取疑似目标文本;2)从已标注的目标文本中提取常用句式,并分为与业务强相关句式、与业务弱相关句式;对待筛选文本进行模糊句式匹配,如果与业务强相关句式匹配,则将文本判断为目标文本,否则为疑似目标文本;3)对每一疑似目标文本进行分类;4)根据疑似目标文本匹配上的关键词的个数确定文本的评估值E1;根据分类判别结果,确定文本的评估值E2;基于文本与外部辅助语料的信息匹配结果确定文本的评估值E3;然后基于评估值E1~E3,计算得到文本最终评分反馈给研判层;5)研判层确定反馈的文本是否为目标文本。
-
公开(公告)号:CN109920406B
公开(公告)日:2021-12-03
申请号:CN201910245435.5
申请日:2019-03-28
Applicant: 国家计算机网络与信息安全管理中心 , 珠海高凌信息科技股份有限公司
Abstract: 本发明的技术方案包括一种基于可变起始位置的动态语音识别方法及系统,用于实现:实时加载输入的语音流信号,对语音信号进行预处理;对语音信号进行特征提取,获取语音信号中的特征;根据语音信号中的特征调用语音模型信息库的多个模型对语音信号进行逐帧模式匹配。本发明的有益效果为:本发明的有益效果为容易理解,实现简单,当前语音模型匹配选取长度较为合理,经过算法改进后,减少了语音模型匹配次数,语音识别效率比之前的算法提高了30%的效率。
-
公开(公告)号:CN112435672A
公开(公告)日:2021-03-02
申请号:CN202011105330.9
申请日:2020-10-15
Applicant: 讯飞智元信息科技有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种声纹识别方法、装置、设备及存储介质,该方法包括:获取用户的包含登录指令待识别的音频数据,输入声纹提取模型,输出声学特征;将所述声学特征输入已训练的声纹识别模型,输出识别文本;根据预先存储的验证音频数据对所述识别文本进行识别,以识别用户身份;响应于所述用户身份识别成功,执行所述登录执行。本发明针对如何解决由于传统声纹识别算法的局限性,通过获取用户的包含登录指令待识别的音频数据,输入声纹提取模型,输出声学特征;将所述声学特征输入已训练的声纹识别模型,输出识别文本;根据预先存储的验证音频数据对所述识别文本进行识别,以识别用户身份,提高音频数据进行登录验证的准确率。
-
公开(公告)号:CN111708887A
公开(公告)日:2020-09-25
申请号:CN202010542354.4
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种自定义规则的多模型融合的不良呼叫识别方法,包括:构建规则策略模型:设置若干条规则,将多条规则通过逻辑运算符连接构成策略,并设置策略的模型融合方式,由所有策略构成规则策略模型;构建识别不良呼叫的卷积神经网络和基于不良呼叫投诉的BERT文本分类模型;根据策略包含的规则的计算式,为每条策略生成递归计算表达式,然后执行递归计算表达式以获得策略执行结果,同时,运行卷积神经网络和BERT文本分类模型以获得输出结果,最后根据每条策略的模型融合方式和执行结果、卷积神经网络和BERT文本分类模型的输出结果,计算得到不良呼叫识别结果。本发明属于信息技术领域,能将规则和隐性表征模型有效融合到不良呼叫识别技术中。
-
公开(公告)号:CN111541645A
公开(公告)日:2020-08-14
申请号:CN202010213474.X
申请日:2020-03-24
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: H04L29/06 , H04L29/12 , H04M7/00 , G06F16/2455 , G06F16/2458 , G06F16/248 , G06N5/02
Abstract: 本发明公开了一种VoIP服务知识库构建方法及系统。本方法为:1)在各选定的物理网关上分别部署一实时流量解析模块,用于从VoIP流量中解析出SIP协议和SDP协议,生成VoIP信令日志发送至消息队列;2)从各消息队列中实时读取VoIP信令日志并对其统一标准化;3)对标准化日志进行实时统计计算,并将统计计算结果实时存入实时结果数据库;4)定期从原始日志数据库中获取标准化日志进行聚合,得到各服务域名下的统计信息;然后基于服务域名下的统计信息和设定的判断条件判断该服务域名所代表的VoIP服务的网关类型、VoIP服务与PSTN的关系以及VoIP服务是否存在可疑行为,并将其保存在VoIP服务基础知识库。
-
公开(公告)号:CN116561244A
公开(公告)日:2023-08-08
申请号:CN202310403811.5
申请日:2023-04-14
Applicant: 国家计算机网络与信息安全管理中心 , 长城计算机软件与系统有限公司
IPC: G06F16/31 , G06F16/35 , G06F40/289 , G06F16/36 , G06F18/214 , G06F18/24 , G06F40/30 , G06N3/0499 , G06N3/0895
Abstract: 本发明实施例涉及一种目标关系的识别方法及装置,所述方法包括:获取目标关系对应的训练数据集和检测数据集;根据上下句预测和掩码预测对联合模型进行模型预训练,得到训练好的联合抽取预训练模型;将所述训练数据集输入到所述联合抽取预训练模型中进行模型训练,得到训练好的联合抽取模型;将所述检测数据集输入到所述联合抽取模型中进行数据抽取处理,得到检测抽取结果;根据所述检测抽取结果确定所述检测数据集对应目标关系的识别结果。通过将检测数据集输入到训练好的联合抽取模型中,实现数据抽取,得到检测抽取结果,将在抽取到的检测抽取结果进行判断分析,确定所述检测数据集的识别结果;由本方案,可以实现企业关系、资本谱系或实体关系的快速识别的技术效果。
-
公开(公告)号:CN116092102A
公开(公告)日:2023-05-09
申请号:CN202211714858.5
申请日:2022-12-27
Applicant: 国家计算机网络与信息安全管理中心 , 长城计算机软件与系统有限公司
IPC: G06V30/412 , G06V30/413 , G06V30/18 , G06V30/162 , G06V30/148 , G06V30/19 , G06V10/44 , G06V10/26 , G06V10/28 , G06V10/48 , G06V10/764 , G06V10/82 , G06N3/044 , G06N3/08
Abstract: 本发明公开了一种包含文本信息的结构图的处理方法,所述方法包括:基于包含文本信息的结构图的线段组成进行轮廓检测;根据检测出的轮廓拟合出几何多边形;基于所述结构图中文本框的特征条件,从所述几何多边形中过滤掉不符合所述特征条件的形状,得到边框。本发明能够从包含有文本信息的结构图中高效、准确地提取出边框。
-
公开(公告)号:CN113077785A
公开(公告)日:2021-07-06
申请号:CN201911300918.7
申请日:2019-12-17
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明属于网络通信技术领域,具体涉及一种端到端的多语言连续语音流语音内容识别方法,该方法包括:将待识别的语音频谱特征输入至预先构建的基于深度神经网络的段级别语种分类模型,提取语句级别语种状态后验概率分布向量;将每一种语言种类的待识别的语音频谱特征序列和语句级别语种状态后验概率分布向量输入至预先构建的多语言语音识别模型,输出对应语言种类的语音识别结果。
-
公开(公告)号:CN110933667A
公开(公告)日:2020-03-27
申请号:CN201910991131.3
申请日:2019-10-18
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司 , 杭州东信北邮信息技术有限公司
Abstract: 一种可扩展的防范诈骗电话的系统与方法,系统包括:前端接入装置,接收并保存扩展管理装置发送的检测策略,同时解析核心网元接收的通话信令,将符合检测策略的通话信令以数据流方式加密后回传给扩展管理装置;扩展管理装置,向前端接入装置分配检测策略,根据前端接入装置发送来的信令流,选择对应的检测装置,然后将信令流解密后再转发给检测装置,最后根据检测装置返回的检测结果,向前端接入装置发送处置命令;检测装置,用于对扩展管理装置发送来的信令流进行检测,然后将检测结果回复给扩展管理装置。本发明属于信息技术领域,能满足运营商不断新增的防范需求和防范诈骗份子不断翻新的诈骗行为。
-
-
-
-
-
-
-
-
-