-
公开(公告)号:CN114974221A
公开(公告)日:2022-08-30
申请号:CN202210465435.8
申请日:2022-04-29
Applicant: 中移互联网有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种语音识别模型训练方法及装置、计算机可读存储介质,本申请提供的方案包括:获取用户对目标语音识别模型输出的语音识别的反馈信息,所述反馈信息包括语音识别的错误文本及错误文本对应的正确文本;获取错误文本对应的语音的说话人语音特征;基于错误文本、错误文本对应的正确文本、错误文本对应的语音的说话人语音特征,确定更新训练样本和对应的标签;基于更新训练样本和对应的标签,对所述目标语音识别模型进行更新训练。
-
公开(公告)号:CN114999438B
公开(公告)日:2023-08-15
申请号:CN202110498738.5
申请日:2021-05-08
Applicant: 中移互联网有限公司 , 中国移动通信集团有限公司
IPC: G10L13/02
Abstract: 本申请公开了一种音频播放方法及装置,该音频播放方法,包括:获取目标用户的用户信息,其中,所述用户信息包括:自定义词库,所述自定义词库中记录有所述目标用户定义的词汇的音频;获取待合成的文本;利用目标语音合成模块对所述待合成的文本进行语音合成,得到所述待合成的文本对应的合成音频;在所述待合成的文本中包括所述目标用户的自定义词库中的第一词汇的情况下,使用第一音频替换所述合成音频中与所述第一词汇对应的音频部分,得到目标音频,其中,所述第一音频为所述自定义词库中的所述第一词汇的音频;播放所述目标音频。
-
公开(公告)号:CN114530145B
公开(公告)日:2023-08-15
申请号:CN202011322395.9
申请日:2020-11-23
Applicant: 中移互联网有限公司 , 中国移动通信集团有限公司
IPC: G10L15/10 , G10L15/18 , G10L15/183 , G10L15/26
Abstract: 本申请实施例公开了一种语音识别结果纠错方法及装置、计算机可读存储介质,该方法包括:将用户输出语音对应的语音识别结果的文本转换为对应的第一拼音序列;根据所述第一拼音序列和预定语料库中的多个第二拼音序列的编辑距离,以及所述用户将所述第一拼音序列中各个第一音节混淆为第二拼音序列中与第一音节对应的第二音节的混淆概率,分别确定所述多个第二拼音序列与所述第一拼音序列的相似度;基于相似度最高的第二拼音序列对所述用户的语音识别结果进行纠错。本申请实施例的方案可以提高语音识别的纠错能力。
-
公开(公告)号:CN114530145A
公开(公告)日:2022-05-24
申请号:CN202011322395.9
申请日:2020-11-23
Applicant: 中移互联网有限公司 , 中国移动通信集团有限公司
IPC: G10L15/10 , G10L15/18 , G10L15/183 , G10L15/26
Abstract: 本申请实施例公开了一种语音识别结果纠错方法及装置、计算机可读存储介质,该方法包括:将用户输出语音对应的语音识别结果的文本转换为对应的第一拼音序列;根据所述第一拼音序列和预定语料库中的多个第二拼音序列的编辑距离,以及所述用户将所述第一拼音序列中各个第一音节混淆为第二拼音序列中与第一音节对应的第二音节的混淆概率,分别确定所述多个第二拼音序列与所述第一拼音序列的相似度;基于相似度最高的第二拼音序列对所述用户的语音识别结果进行纠错。本申请实施例的方案可以提高语音识别的纠错能力。
-
公开(公告)号:CN119012195A
公开(公告)日:2024-11-22
申请号:CN202411164755.5
申请日:2024-08-23
Applicant: 中移互联网有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种号码识别方法,所述方法包括:在监测到目标副号发起呼叫请求的情况下,获取与所述目标副号对应的目标标识码和目标主号,其中,所述目标标识码为所述目标副号对应的副号设备的标识码;在根据所述目标标识码检索到目标高危号码合集,且所述目标高危号码合集中存在所述目标主号的情况下,获取与所述目标主号对应的预设音频,以及获取当前通话音频;通过比对所述预设音频和所述当前通话音频,识别所述目标副号是否为诈骗号码。
-
公开(公告)号:CN114974221B
公开(公告)日:2024-01-19
申请号:CN202210465435.8
申请日:2022-04-29
Applicant: 中移互联网有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种语音识别模型训练方法及装置、计算机可读存储介质,本申请提供的方案包括:获取用户对目标语音识别模型输出的语音识别的反馈信息,所述反馈信息包括语音识别的错误文本及错误文本对应的正确文本;获取错误文本对应的语音的说话人语音特征;基于错误文本、错误文本对应的正确文本、错误文本对应的语音的说话人语音特征,确定更新训练样本和对应的标签;基于更新训练样本和对应的标签,对所述目标语音识别模型进行更新训练。
-
公开(公告)号:CN114999438A
公开(公告)日:2022-09-02
申请号:CN202110498738.5
申请日:2021-05-08
Applicant: 中移互联网有限公司 , 中国移动通信集团有限公司
IPC: G10L13/02
Abstract: 本申请公开了一种音频播放方法及装置,该音频播放方法,包括:获取目标用户的用户信息,其中,所述用户信息包括:自定义词库,所述自定义词库中记录有所述目标用户定义的词汇的音频;获取待合成的文本;利用目标语音合成模块对所述待合成的文本进行语音合成,得到所述待合成的文本对应的合成音频;在所述待合成的文本中包括所述目标用户的自定义词库中的第一词汇的情况下,使用第一音频替换所述合成音频中与所述第一词汇对应的音频部分,得到目标音频,其中,所述第一音频为所述自定义词库中的所述第一词汇的音频;播放所述目标音频。
-
公开(公告)号:CN119052377A
公开(公告)日:2024-11-29
申请号:CN202411054683.9
申请日:2024-08-02
Applicant: 中移互联网有限公司 , 中国移动通信集团有限公司
Abstract: 本说明书一个实施例提供了一种通话响应处理方法和装置,该方法包括:首先获取用户的通话录音,并对通话录音进行文本转换获得通话文本,再将通话文本输入需求识别网络进行需求识别,获得需求类别和需求衍生数据,然后根据需求类别和需求衍生数据二者中至少一者确定通话响应策略,并按照通话响应策略中的数据生成方式和需求衍生数据生成通话响应数据,最后按照通话响应数据和通话响应策略中的通话响应渠道,进行用户的通话响应,提升通话响应的有效性。
-
公开(公告)号:CN118866014A
公开(公告)日:2024-10-29
申请号:CN202411055062.2
申请日:2024-08-02
Applicant: 中移互联网有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开一种语音情感识别方法,属于语音情感识别技术领域。该方法包括:对获取的目标语音进行音频分帧处理,得到目标语音的至少一个音频帧;提取目标语音的语义特征和声学特征,以及提取至少一个音频帧的语谱图和梅尔频谱系数;根据语义特征、声学特征、至少一个音频帧的语谱图和梅尔频谱系数,确定语音情感识别特征;根据语音情感识别特征,确定目标语音的情感识别结果。这样,通过在目标语音的情感识别过程中引入语义特征,并根据语义特征、声学特征、至少一个音频帧的语谱图和梅尔频谱系数,确定语音情感识别特征,可以更加全面地识别目标语音中的情感信息,提高语音情感识别的准确率。
-
公开(公告)号:CN114598773B
公开(公告)日:2023-09-05
申请号:CN202011395506.9
申请日:2020-12-03
Applicant: 中移互联网有限公司 , 中国移动通信集团有限公司
Abstract: 本申请提供一种智能应答系统及方法。系统包括:智能应答中台和接入智能应答中台的多个智能应答接入平台,智能应答中台包括:前置机、业务处理模块、服务分流模块;前置机在接收到主叫方的话务时,从业务处理模块获取业务信息并将主叫方的语音流和业务信息封装后发送给服务分流模块,业务信息包括主叫方的历史应答特征和/或被叫方预设的应答服务配置,应答服务配置用于表征被叫方所需的应答服务特征;服务分流模块选出与业务信息相匹配的目标智能应答接入平台,并将语音流分发给目标智能应答接入平台进行应答处理。由此可知,本申请通过增加接入多个智能应答接入平台的智能应答中台,可实现不同应答场景下定制化配置智能应答产品。
-
-
-
-
-
-
-
-
-