-
公开(公告)号:CN111863007A
公开(公告)日:2020-10-30
申请号:CN202010554629.6
申请日:2020-06-17
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
IPC: G10L21/0208 , G10L21/0272 , G06N3/04
Abstract: 本发明公开了一种基于深度学习的语音增强方法及系统,该方法包括如下步骤:步骤SS1:获得带噪语音的多个IRM预测值的解的集合;步骤SS2:将来自所述Boosting-DNN语音增强模型输出的IRM的解的集合拼接带噪特征作为输入,预测最终的IRM预测值集合 本发明通过将Boosting-DNN语音增强模型和Ensemble-DNN集成语音增强模型这两个DNN串接起来的方式,有效的解决了一个神经网络由于层次太深训练不稳定的现象,构建一种非常深的网络结构,彻底解决前端语音增强技术就可以确保把语音从带噪信号中分离出来,以便后端识别模型能正确识别语音的内容。
-
公开(公告)号:CN119311871A
公开(公告)日:2025-01-14
申请号:CN202411222450.5
申请日:2024-09-02
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/36 , G06F18/25 , G06F18/213 , G06N3/045
Abstract: 本申请涉及舆情监测技术领域,公开一种面向噪声文本信息的检测方法及系统,所述方法包括:获取目标数据集;对目标数据集进行预处理,获取预处理后的文本特征;构成汉化文本分类模型预训练模型,其中,汉化文本分类模型预训练模型用于预处理后的文本特征,以获取文本的表示向量;构建两个结构不同的基于汉化文本分类预训练模型作为双塔模型的基分类器A和基分类器B;用相同数据集对基分类器A和基分类器B进行调整。本发明能够对双塔模型进行相互校验,对双塔模型的输出结果进行综合考量,并输出最终结果,从而有效提高整体的特定内容检测准确率。
-
公开(公告)号:CN117711393A
公开(公告)日:2024-03-15
申请号:CN202311695998.7
申请日:2023-12-11
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及语音识别技术领域,提供一种语音对抗样本的防御方法、装置、设备和存储介质,该方法包括:获取原始语音指令对应的原始识别结果和降噪后的识别结果;在确定原始识别结果与降噪后的识别结果不相同的情况下,根据白噪声异常度和预设的异常度阈值,确定降噪后的识别结果对应的第一指令是否为语音对抗样本;白噪声异常度用于表征输入原始语音指令至语音识别模型时原始语音指令和所处的环境的环境噪声的相关程度;在第一指令为语音对抗样本的情况下,将第一指令进行作废。本发明提升了语音对抗样本的防御效果。
-
公开(公告)号:CN115525758A
公开(公告)日:2022-12-27
申请号:CN202210628092.2
申请日:2022-06-06
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种基于SVM的特定文本大数据分析方法及系统,所述一种基于SVM的特定文本大数据分析方法包括:利用历史特定文本大数据得到历史特定文本大数据特征;利用所述历史特定文本大数据特征获取历史特定文本大数据分析结果,采用SVM的大数据分析系统的技术,全面提高特定文本的分类的准确性和覆盖率,通过在海量数据中实现对特定内容的精准分类,大大提高了特定内容分类的及时性和准确性,从而提高了系统层面对特定内容处理的流转环节,大大提高了应用系统的处理能力。
-
公开(公告)号:CN115238703A
公开(公告)日:2022-10-25
申请号:CN202210616914.5
申请日:2022-06-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/289 , G06F16/35 , G06N20/00
Abstract: 本发明涉及一种包含历史深度语义特定文本的识别方法及系统,所述一种包含历史深度语义特定文本的识别方法包括:利用历史深度语义特定文本数据进行初始处理得到历史深度语义特定文本初始数据;利用所述历史深度语义特定文本初始数据得到历史深度语义特定文本识别结果,通过大数据分析特定文本进行模型训练,并对特定内容的语义特征进行分析筛除,进而进行分类、识别及定性,提升了对于特定文本的识别准确率,避免误差的产生。
-
公开(公告)号:CN111641531A
公开(公告)日:2020-09-08
申请号:CN202010399499.3
申请日:2020-05-12
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种基于DPDK的数据包分发和特征提取方法,包括:步骤一、设置多台Worker服务器和1台采集Proxy服务器,并对每台服务器预先进行DPDK环境部署;步骤二、采集Proxy服务器从绑定网卡中读取网络数据包并存入缓冲区中,同时,按照每个数据包的五元组信息,将缓存区中五元组信息相对应的所有数据包分发给其中1台对应的Worker服务器;步骤三、每台Worker服务器从收到的数据包中提取数据特征信息。本发明属于信息技术领域,能有效提高对网络海量数据包的处理效率和正确率。
-
公开(公告)号:CN113052270B
公开(公告)日:2024-12-24
申请号:CN202110503779.9
申请日:2021-05-10
Applicant: 清华大学 , 国家计算机网络与信息安全管理中心
IPC: G06F18/21 , G06F18/241 , G06F18/22
Abstract: 本申请涉及一种分类精度评价方法、装置、计算机设备和存储介质。所述方法包括:获取有害语音样本集;将有害语音样本集中的每个有害语音样本输入待评价的有害语音分类模型中进行分类,得到预测类别标签;在预设的分类层级中,确定与预测类别标签和有害语音样本的样本类别标签对应的目标分类;根据目标分类计算待评价的有害语音分类模型的分类精确程度。本方案中,对有害语音样本进行了多层次的分类(即分类层级),然后在分类层级中确定预测类别标签和样本类别标签共同所属的目标分类,目标分类可以反映预测类别标签和样本类别标签的匹配度,进而根据目标分类确定分类模型的分类精确程度,能够有效的提高分类模型评价的准确度。
-
公开(公告)号:CN115914056B
公开(公告)日:2024-12-17
申请号:CN202110914688.4
申请日:2021-08-10
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L43/50 , H04L65/1104 , H04L67/02 , H04L67/141
Abstract: 本申请提供一种网络电话服务端的识别方法及装置、系统、电子设备,该方法包括:获取SIP流量,对SIP流量进行分析,获得目的IP信息;根据目的IP信息,对目标服务端的通信端口进行扫描,查找开放服务的目标端口;与开放服务的目标端口建立连接,并向开放服务的目标端口发送HTTP报文;根据HTTP报文的响应消息,确定目标服务端是否为网络电话服务端。由此可以高效地过滤出网络中大部分的VoIP运营平台信息,比传统的被动解析方式需要的资源更少且更加灵活,比传统的主动方式更加高效、目的性更强。在消耗少量资源的情况下,可以高效的进行定向分析,大大提高整体分析的高效性。
-
公开(公告)号:CN111858925B
公开(公告)日:2023-08-18
申请号:CN202010501138.5
申请日:2020-06-04
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/335 , G06F40/211 , G06F40/289 , G06Q30/018 , G06Q50/32
Abstract: 本发明公开了电信网络诈骗事件的剧本提取方法、装置、电子设备以及存储介质。该方法包括:获取已知主题类别的电信网络诈骗事件文本;对文本进行分句操作;提取文本中各单句的关键词;利用预先建立的BERT模型提取已知主题类别的电信网络诈骗事件文本中各单句的关键词向量;基于任意两个具有相邻句序的单句的关键词向量的均值向量之间的空间距离,对两个具有相邻句序的单句进行剧情阶段的划分;获取各阶段所包含的单句的关键词作为所属的主题类别下电信网络诈骗事件中各阶段的情节特征的表示。本发明实现了对于电信网络诈骗事件剧情阶段的划分,提取出有助于识别电信网络诈骗事件的特征,从而达到精准提取电信网络诈骗事件剧本的目的。
-
公开(公告)号:CN111669757B
公开(公告)日:2023-03-14
申请号:CN202010542362.9
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
IPC: H04W12/12 , G06F40/211 , G06F40/284 , G06F40/30 , G06N3/04
Abstract: 一种基于通话文本词向量的终端诈骗电话识别方法,包括:用户在终端App中标记来话,当标记为诈骗类别时,经用户授权同意后转化为文本,由用户检视和脱敏,并在用户授权后上传服务器保存为文本样本;对文本样本进行分词和词性标注,获得分词的句法依存标签和词组合向量,再将词组合向量、词性标注和句法依存标签拼合构成分词的内容向量,计算分词所属的情景要素标签,以获得文本样本的语义向量;构建诈骗分类识别模型,使用服务器中文本样本作为训练样本,然后将训练好的模型从服务器端推送给App;App接收新的待识别通话后,根据模型获得其所属的涉诈类别,并提示用户。本发明属于信息技术领域,能基于通话文本准确识别诈骗电话。
-
-
-
-
-
-
-
-
-