-
公开(公告)号:CN114283852A
公开(公告)日:2022-04-05
申请号:CN202111004261.7
申请日:2021-08-30
Applicant: 腾讯科技(深圳)有限公司 , 北京语言大学
Abstract: 本申请涉及一种发音偏误检测方法、装置、计算机设备和存储介质。所述方法包括:获取语音信息以及语音信息对应的标准发音文本信息;根据语音信息和标准发音文本信息进行语音识别,获得语音信息对应的预测发音文本信息;根据预测发音文本信息和标准发音文本信息,对语音信息的发音偏误进行检测。采用本方法能够提升发音偏误检测准确性。
-
公开(公告)号:CN113409768A
公开(公告)日:2021-09-17
申请号:CN202011119857.7
申请日:2020-10-19
Applicant: 腾讯科技(深圳)有限公司 , 北京语言大学
Abstract: 本申请的实施例基于人工智能中的语音技术和机器学习方法,提供了一种发音检测方法、装置及计算机可读介质。该发音检测方法包括:从待检测的语音音频中提取音频帧特征;基于所述音频帧特征与预设第一语言中的第一语音音素之间的匹配度,生成第一后验概率,并基于所述音频帧特征与预设第二语言中的第二语音音素之间的匹配度,生成第二后验概率;对所述第一后验概率和所述第二后验概率进行神经网络回归处理,生成所述语音音频中的音素对应于第二语言音素的概率得分。本申请实施例的技术方案可以得到精确的发音检测结果,提高发音检测的精确性和发音者的练习效率。
-
公开(公告)号:CN110428803B
公开(公告)日:2020-04-28
申请号:CN201910662424.7
申请日:2019-07-22
Applicant: 北京语言大学
Abstract: 本发明提供一种基于发音属性的发音人国别识别模型建模方法及系统,包括:将汉语音段划分成多种发音属性类别;针对划分出的每一发音属性类别分别进行建模,并利用大规模普通话语料库作为训练数据集进行训练,得到多个发音属性特征提取器;将参与后续国别识别任务的所有二语语料输入各发音属性特征提取器中,对应每一帧语音的多个不同的发音属性,得到多组不同维度的发音属性特征;将各发音属性特征对应的属性后验概率进行拼接,得到每帧的发音属性超向量;使用发音属性超向量训练深度神经网络得到第一国别识别模型。本发明的国别识别方法识别准确率高,且采用本发明方法不需考虑发音人所说内容,也不需考虑当前所说的语言种类,都可识别出其国别。
-
公开(公告)号:CN113327595B
公开(公告)日:2022-08-02
申请号:CN202110667154.6
申请日:2021-06-16
Applicant: 北京语言大学
Abstract: 本发明提供了一种发音偏误检测方法、装置及存储介质,所述方法包括构建语音预训练模型,并基于无标注语音语料库对所述语音预训练模型进行预训练;在所述语音预训练模型上添加一层随机初始化的全连接层,得到微调预训练模型,并使用带标注的发音偏误数据对所述微调预训练模型进行训练,得到发音偏误检测模型;利用所述发音偏误检测模型对学习者的语音进行检测,以获得发音偏误信息。本发明所述发音偏误检测方法、装置及存储介质,通过构建语音预训练模型、微调预训练模型,利用发音偏误检测模型对学习者的语音进行检测以获得发音偏误信息的方式,使得在缺少发音训练数据情况下,依然可以有效提升发音偏误检测系统的性能。
-
公开(公告)号:CN113327595A
公开(公告)日:2021-08-31
申请号:CN202110667154.6
申请日:2021-06-16
Applicant: 北京语言大学
Abstract: 本发明提供了一种发音偏误检测方法、装置及存储介质,所述方法包括构建语音预训练模型,并基于无标注语音语料库对所述语音预训练模型进行预训练;在所述语音预训练模型上添加一层随机初始化的全连接层,得到微调预训练模型,并使用带标注的发音偏误数据对所述微调预训练模型进行训练,得到发音偏误检测模型;利用所述发音偏误检测模型对学习者的语音进行检测,以获得发音偏误信息。本发明所述发音偏误检测方法、装置及存储介质,通过构建语音预训练模型、微调预训练模型,利用发音偏误检测模型对学习者的语音进行检测以获得发音偏误信息的方式,使得在缺少发音训练数据情况下,依然可以有效提升发音偏误检测系统的性能。
-
公开(公告)号:CN110428803A
公开(公告)日:2019-11-08
申请号:CN201910662424.7
申请日:2019-07-22
Applicant: 北京语言大学
Abstract: 本发明提供一种基于发音属性的发音人国别识别方法及系统,包括:将汉语音段划分成多种发音属性类别;针对划分出的每一发音属性类别分别进行建模,并利用大规模普通话语料库作为训练数据集进行训练,得到多个发音属性特征提取器;将参与后续国别识别任务的所有二语语料输入各发音属性特征提取器中,对应每一帧语音的多个不同的发音属性,得到多组不同维度的发音属性特征;将各发音属性特征对应的属性后验概率进行拼接,得到每帧的发音属性超向量;使用发音属性超向量训练深度神经网络得到第一国别识别模型。本发明的国别识别方法识别准确率高,且采用本发明方法不需要考虑发音人所说的内容,也不需要考虑当前所说的语言种类,都可以识别出其国别。
-
-
-
-
-