-
公开(公告)号:CN112331181A
公开(公告)日:2021-02-05
申请号:CN201910694870.6
申请日:2019-07-30
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明属于目标语音提取和自适应技术领域,具体涉及一种基于多说话人条件下目标说话人语音提取方法,该方法具体包括:实时获取多个说话人混合的语音,提取多个说话人混合的语音的频谱;将锚语音输入到预先训练的说话人识别模型中,提取出目标说话人的特征向量;将获取的多个说话人混合的语音的频谱和目标说话人的特征向量输入至预先训练的目标说话人语音提取网络中,获取目标说话人的语音频谱;基于该目标说话人的语音频谱,获取目标说话人的语音。
-
公开(公告)号:CN110213449B
公开(公告)日:2020-12-25
申请号:CN201910413883.1
申请日:2019-05-17
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司 , 长安通信科技有限责任公司
Abstract: 一种漫游诈骗号码的识别方法,包括:获取所有待识别漫游号码的主叫话单,并将话单划分成多个开卡渠道‑开卡时间组,然后根据待识别漫游号码的通信指标,分类确定疑似诈骗和非疑似诈骗的开卡渠道‑开卡时间组,并据此计算所有待识别漫游号码的诈骗标识值,将所有诈骗标识值构成一个诈骗标识集;选取多个特征属性构成特征属性集;对所有待识别漫游号码进行M次诈骗号码的判定分类,将每次进行判定分类后获得的所有待识别漫游号码的诈骗特征分类判定值构成一个诈骗特征分类判定集;根据诈骗标识集和M个诈骗特征分类判定集,计算所有待识别漫游号码的诈骗判定值,以识别出诈骗号码。本发明属于信息技术领域,能从现有话单中精确识别漫游诈骗号码。
-
公开(公告)号:CN111722976A
公开(公告)日:2020-09-29
申请号:CN202010425228.0
申请日:2020-05-19
Applicant: 珠海高凌信息科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F11/30
Abstract: 本发明涉及一种基于智能运维的故障流程分析方法、装置及介质的技术方案,包括:获取设备的历史业务数据,构建告警对应的知识库;获取设备当前的告警数据,自动对告警数据进行多维度的关联分析,根据关联分析结果配知识库,获取对应的设备故障处理流程;根据设备故障处置流程向设备下发对应的操作流程。本发明的有益效果为:本发明的有益效果为:经过智能运维支撑平台等告警智能关联分析、自动处置等过程,能够将统一类告警源的告警归类,有效节省了运维时间;并且能根据业务系统运行数据,精确判断出故障发生源,依靠告警处理模型,自动处理告警。据评估,可大大节省运维的时间,从而节省了运维成本。
-
公开(公告)号:CN110930982A
公开(公告)日:2020-03-27
申请号:CN201911050896.3
申请日:2019-10-31
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
Abstract: 本发明提供一种多口音声学模型和多口音语音识别方法,所述多口音声学模型包括多个BLSTM层、多个Softmax输出层和一个门控单元,多个BLSTM层依次串接后与每一个Softmax输出层串接,门控单元位于所述多个BLSTM层中的其中两个相邻的BLSTM层之间。本发明对传统的普通话声学模型构造进行改进,针对需要识别的多种口音数据的类别数量,将传统的普通话声学模型中的Softmax输出层复制多份,每一个Softmax输出层为口音特定输出层,将输出层设计为口音特定的形式,即每种口音独享其对应的输出层;而门控单元对神经网络的BLSTM层的输出进行一种口音特定的调节,以使该模型更好地适用于多种口音。
-
公开(公告)号:CN110119648A
公开(公告)日:2019-08-13
申请号:CN201810111564.0
申请日:2018-02-05
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
Abstract: 本发明公开了一种基于光学字符识别的传真图像分类方法,所述方法包括:步骤1)对扫描得到的传真图像进行噪声消除;步骤2)对噪声消除后的传真图像进行二值化处理;步骤3)对步骤2)得到的二值化图像进行仿射变换校准文本;步骤4)利用OCR方法对步骤3)处理后的传真图像进行识别,得到编码为UTF-8的输出字符串和转写置信度;步骤5)对字符串进行关键词正则匹配,得到传真图像的分类。本发明的方法利用频谱噪声消除和灰度图像二值化的预处理,在满足实时性要求的前提下提升了电子扫描得到的传真图像的质量;使传真图像能够使用基于OCR的分类方法,由此实现了传真图像的自动化分类。
-
公开(公告)号:CN110111814A
公开(公告)日:2019-08-09
申请号:CN201910419117.6
申请日:2019-05-20
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明实施例提供一种网络类型识别方法及装置。所述方法包括:获取待识别语音;将待识别语音输入至预设的网络识别模型,得到识别结果;其中,所述网络识别模型为通过样本数据对随机森林模型以及支持向量机模型进行预设数据训练得到的。本发明实施例将网络类型识别的过程自动化实现,效率较高,可有效降低人工成本;且网络识别通过机器学习的方式建立,满足精确度需求;预先通过大量样本数据建立网络识别模型,适用于VoIP通话;本发明实施例解决了现有技术中,VoIP电话的出现使得难以准确地根据号码判断主叫方网络类型的问题。
-
公开(公告)号:CN119863846A
公开(公告)日:2025-04-22
申请号:CN202411792800.1
申请日:2024-12-07
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提供了一种人脸匿名化方法,包括:筛选从视图数据中检出的人脸图像;从所述人脸图像中获取关键点的特征向量和高维嵌入的表征向量;构造与所述表征向量同维度的随机向量,将所述表征向量结合所述随机向量和为所述随机向量设定的噪声系数,计算扰动表征向量;将所述扰动表征向量和所述特征向量拼接后获得随机扰动后的人脸图像,以所述随机扰动后的人脸图像替换所述人脸图像。本发明有益效果:通过对人脸属性特征的的修改,不改变人脸基本状态的情况下就可以隐藏特定个人的属性特征信息,同时不会影响视觉效果。
-
公开(公告)号:CN119741919A
公开(公告)日:2025-04-01
申请号:CN202411802628.3
申请日:2024-12-09
Applicant: 国家计算机网络与信息安全管理中心
IPC: G10L15/22 , G10L13/02 , G10L21/007 , G06F40/151 , G10L25/30
Abstract: 本发明提供了一种语音匿名化方法,包括:将语音数据按照激活检测结果分割为语音数据片段,转写所述语音数据片段为文本序列;由敏感词列表和所述文本序列对比以获取敏感词,以敏感词替换符替换所述敏感词,生成脱敏文本片段;根据所述脱敏文本片段生成文本嵌入表征码,与随机声纹嵌入表征码拼接,生成拼接表征码;通过后向解码网络将所述拼接表征码解码为时频谱后,声码器将所述时频谱转化为音频波形。本发明有益效果:通过对语音声纹的修改和敏感词的提出,实现的在不改变语音数据属性的条件下,对语音数据脱敏和匿名化。
-
公开(公告)号:CN113761919B
公开(公告)日:2025-01-07
申请号:CN202010500426.9
申请日:2020-06-04
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/211
Abstract: 本发明提供一种口语化短文本的实体属性提取方法及电子装置,包括对口语化短文本切词及词性标注,并对各标注词性的词语进行命名主体识别,得到实体词语;将口语化短文本映射为主谓宾三元组,获取主谓宾三元组中各词语的依存关系,并使用实体词语对主谓宾三元组中各词语进行实体识别;当主谓宾三元组中的主谓宾满足一触发规则时,提取宾语词组作为实体属性。本发明采用词性标注、依存句法分析、实体识别以及结合触发词词性规则的综合方法,更加有针对性的提取了口语化短数据的实体属性信息,丰富了口语化短文本领域的结构化信息抽取方法。
-
公开(公告)号:CN118332103A
公开(公告)日:2024-07-12
申请号:CN202410507046.6
申请日:2024-04-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/34 , G06F16/35 , G06F16/33 , G06F16/332 , G06F40/30 , G06F40/284 , G06N3/0455 , G06N3/047 , G06N3/084
Abstract: 本公开提供一种主题提取方法、装置、相关设备和计算机程序产品,涉及计算机与互联网技术领域。主题提取方法包括:获取多个文本和多个热点关键词,热点关键词是从网络中获得的;根据多个热点关键词对各个文本分别进行关键词匹配,以确定各个文本中的文本关键词;通过文本关键词对多个文本进行文本聚类,以确定至少一个文本组;将每个文本组中命中热点关键词最多的文本作为文本组的主题。本公开实施例可以快速且准确的从多个文本中提取出主题信息。
-
-
-
-
-
-
-
-
-