-
公开(公告)号:CN115083437B
公开(公告)日:2023-04-07
申请号:CN202210535600.2
申请日:2022-05-17
Applicant: 北京语言大学
Abstract: 本发明涉及发音质量评估技术领域,特别是指一种确定学习者发音的不确定性的方法及装置。方法包括:获取学习者的发音数据;基于所述学习者的发音数据,获取基准测听数据;基于所述学习者的发音数据以及所述基准测听数据,构建所述学习者的音素混淆矩阵,根据所述学习者的音素混淆矩阵,确定所述学习者的发音的不确定性。采用本发明,可以对学习者发音的不确定性进行量化,并且对不同音素发音的不确定性进行单一向量的对比研究。
-
公开(公告)号:CN113299267B
公开(公告)日:2021-10-15
申请号:CN202110841392.4
申请日:2021-07-26
Applicant: 北京语言大学
Abstract: 本发明公开了一种基于变分自编码器的语音刺激连续统合成方法及装置,所述方法包括:从原始语音信号中提取关键声学线索;基于变分自编码器进行关键声学线索建模,并进行训练;利用训练好的关键声学线索模型合成语音连续统。所述装置包括:提取模块,用于从原始语音信号中提取关键声学线索;模型建立模块,用于基于变分自编码器进行关键声学线索建模,并进行训练;合成模块,用于利用训练好的关键声学线索模型合成语音连续统。本发明通过深度学习模型来合成感知实验中所需要的语音刺激连续统,能够解决现有技术中手动修改造成的信息损失和不自然的问题。
-
公开(公告)号:CN113299267A
公开(公告)日:2021-08-24
申请号:CN202110841392.4
申请日:2021-07-26
Applicant: 北京语言大学
Abstract: 本发明公开了一种基于变分自编码器的语音刺激连续统合成方法及装置,所述方法包括:从原始语音信号中提取关键声学线索;基于变分自编码器进行关键声学线索建模,并进行训练;利用训练好的关键声学线索模型合成语音连续统。所述装置包括:提取模块,用于从原始语音信号中提取关键声学线索;模型建立模块,用于基于变分自编码器进行关键声学线索建模,并进行训练;合成模块,用于利用训练好的关键声学线索模型合成语音连续统。本发明通过深度学习模型来合成感知实验中所需要的语音刺激连续统,能够解决现有技术中手动修改造成的信息损失和不自然的问题。
-
公开(公告)号:CN110415725B
公开(公告)日:2020-06-02
申请号:CN201910636633.4
申请日:2019-07-15
Applicant: 北京语言大学
Abstract: 本发明提供一种使用第一语言数据评估第二语言发音质量的方法及系统,包括:划分出多个发音属性;针对每一发音属性分别建立与其对应的属性模型;获取第一语言的语音数据构建训练数据集,基于划分的发音属性将训练数据集中的语音数据映射为多个分别与各属性模型对应的发音属性特征集;针对每一属性模型分别采用对应的发音属性特征集进行训练;获取待评估的第二语言的语音数据,利用训练好的属性模型对所述第二语言的发音质量进行评估。本发明使用第一语言数据进行建模,对第二语言的发音质量进行测试评估,所提供的方法能做到所有语言通用,所建模型可用于发音偏误检测,音素识别等多种单项任务,还可以作为前端任务为后端提供准确的语音知识特征。
-
公开(公告)号:CN110415725A
公开(公告)日:2019-11-05
申请号:CN201910636633.4
申请日:2019-07-15
Applicant: 北京语言大学
Abstract: 本发明提供一种使用第一语言数据评估第二语言发音质量的方法及系统,包括:划分出多个发音属性;针对每一发音属性分别建立与其对应的属性模型;获取第一语言的语音数据构建训练数据集,基于划分的发音属性将训练数据集中的语音数据映射为多个分别与各属性模型对应的发音属性特征集;针对每一属性模型分别采用对应的发音属性特征集进行训练;获取待评估的第二语言的语音数据,利用训练好的属性模型对所述第二语言的发音质量进行评估。本发明使用第一语言数据进行建模,对第二语言的发音质量进行测试评估,所提供的方法能做到所有语言通用,所建模型可用于发音偏误检测,音素识别等多种单项任务,还可以作为前端任务为后端提供准确的语音知识特征。
-
公开(公告)号:CN106205603B
公开(公告)日:2019-06-07
申请号:CN201610757767.8
申请日:2016-08-29
Applicant: 北京语言大学
IPC: G10L13/08
Abstract: 本发明公开了一种声调评估方法,包括:分别建立基于帧级别特征的声调模型和基于音段级别特征的声调模型;根据所述基于帧级别特征的声调模型获取待识别语音的平均帧级别后验概率和对数后验比;根据基于音段级别特征的声调模型获取所述待识别语音的音段层级对数后验概率;根据所述平均帧级别后验概率、所述对数后验比以及所述音段层级对数后验概率对所述待识别语音进行声调评估。根据本发明的声调评估方法,可以提高声调评估的鲁棒性。
-
公开(公告)号:CN108922516A
公开(公告)日:2018-11-30
申请号:CN201810697966.3
申请日:2018-06-29
Applicant: 北京语言大学
Abstract: 本发明公开了一种检测调域值的方法和装置。其中,该方法包括:采用获取频谱特征和调域值,其中,频谱特征是与音质有关的频谱参数,调域值是话者的调域高度值和/或调域宽度值;根据频谱特征和调域值通过机器学习算法训练预测模型,其中,预测模型是频谱特征和调域值建立的映射关系;输入待检测频谱特征利用预测模型获得待检测调域值,其中,待检测调域值与待检测频谱特征相对应,待检测频谱特征是从话者的待预测语音中截取的方式。本发明解决了现有技术在用户不确定情况下需要较长的输入语音样本来估计调域而导致的准确率和速度都较低的技术问题。
-
公开(公告)号:CN106205603A
公开(公告)日:2016-12-07
申请号:CN201610757767.8
申请日:2016-08-29
Applicant: 北京语言大学
IPC: G10L13/08
CPC classification number: G10L13/08
Abstract: 本发明公开了一种声调评估方法,包括:分别建立基于帧级别特征的声调模型和基于音段级别特征的声调模型;根据所述基于帧级别特征的声调模型获取待识别语音的平均帧级别后验概率和对数后验比;根据基于音段级别特征的声调模型获取所述待识别语音的音段层级对数后验概率;根据所述平均帧级别后验概率、所述对数后验比以及所述音段层级对数后验概率对所述待识别语音进行声调评估。根据本发明的声调评估方法,可以提高声调评估的鲁棒性。
-
公开(公告)号:CN103021226A
公开(公告)日:2013-04-03
申请号:CN201210473420.2
申请日:2012-11-20
Applicant: 北京语言大学
IPC: G09B19/06
Abstract: 本发明涉及一种基于发音节奏的语音评测方法及装置,该装置包括:GMM模型获取单元用于从被评测语音中选出训练数据,提取出所述训练数据的节奏特征参数进行训练得到GMM模型;似然度获取单元提取被评测语音的节奏特征参数作为所述GMM模型的输入,经GMM模型匹配获取相应的似然度值;评测模型获取单元用于所述似然度经过训练评测模型,根据所述评测模型对被评测语音的发音节奏进行评测。本申请所提出的技术方案用于辅助语言教学,尤其是对外汉语的教学,满足了学生学习语言的需要。另外,能及时发现学生的语音节奏中的偏误并给予他们有效的反馈,将会提高他们的语言学习效率。尤其在于日本学生学习汉语方面。
-
-
-
-
-
-
-
-
-