-
公开(公告)号:CN106486112A
公开(公告)日:2017-03-08
申请号:CN201610895450.0
申请日:2016-10-13
Applicant: 北京语言大学
CPC classification number: G10L15/02 , G10L13/10 , G10L15/04 , G10L15/063 , G10L15/16 , G10L2015/027 , G10L2015/0631
Abstract: 本发明提供一种基于声调核声学特征及深度神经网络的韵律边界检测方法,所述方法包括:检测并获取音节声调核部分的声学特征;基于深度神经网络利用音节声调核部分的声学特征建立韵律边界建模对韵律边界进行检测。通过检测并获取音节声调核部分的声学特征和时长特征,并基于深度神经网络利用音节声调核部分的声学特征和时长特征建立韵律边界建模对韵律边界进行检测,能够有效提高韵律边界检测的正确率。
-
公开(公告)号:CN106205603B
公开(公告)日:2019-06-07
申请号:CN201610757767.8
申请日:2016-08-29
Applicant: 北京语言大学
IPC: G10L13/08
Abstract: 本发明公开了一种声调评估方法,包括:分别建立基于帧级别特征的声调模型和基于音段级别特征的声调模型;根据所述基于帧级别特征的声调模型获取待识别语音的平均帧级别后验概率和对数后验比;根据基于音段级别特征的声调模型获取所述待识别语音的音段层级对数后验概率;根据所述平均帧级别后验概率、所述对数后验比以及所述音段层级对数后验概率对所述待识别语音进行声调评估。根据本发明的声调评估方法,可以提高声调评估的鲁棒性。
-
公开(公告)号:CN108922516A
公开(公告)日:2018-11-30
申请号:CN201810697966.3
申请日:2018-06-29
Applicant: 北京语言大学
Abstract: 本发明公开了一种检测调域值的方法和装置。其中,该方法包括:采用获取频谱特征和调域值,其中,频谱特征是与音质有关的频谱参数,调域值是话者的调域高度值和/或调域宽度值;根据频谱特征和调域值通过机器学习算法训练预测模型,其中,预测模型是频谱特征和调域值建立的映射关系;输入待检测频谱特征利用预测模型获得待检测调域值,其中,待检测调域值与待检测频谱特征相对应,待检测频谱特征是从话者的待预测语音中截取的方式。本发明解决了现有技术在用户不确定情况下需要较长的输入语音样本来估计调域而导致的准确率和速度都较低的技术问题。
-
公开(公告)号:CN106205603A
公开(公告)日:2016-12-07
申请号:CN201610757767.8
申请日:2016-08-29
Applicant: 北京语言大学
IPC: G10L13/08
CPC classification number: G10L13/08
Abstract: 本发明公开了一种声调评估方法,包括:分别建立基于帧级别特征的声调模型和基于音段级别特征的声调模型;根据所述基于帧级别特征的声调模型获取待识别语音的平均帧级别后验概率和对数后验比;根据基于音段级别特征的声调模型获取所述待识别语音的音段层级对数后验概率;根据所述平均帧级别后验概率、所述对数后验比以及所述音段层级对数后验概率对所述待识别语音进行声调评估。根据本发明的声调评估方法,可以提高声调评估的鲁棒性。
-
公开(公告)号:CN108922516B
公开(公告)日:2020-11-06
申请号:CN201810697966.3
申请日:2018-06-29
Applicant: 北京语言大学
Abstract: 本发明公开了一种检测调域值的方法和装置。其中,该方法包括:采用获取频谱特征和调域值,其中,频谱特征是与音质有关的频谱参数,调域值是话者的调域高度值和/或调域宽度值;根据频谱特征和调域值通过机器学习算法训练预测模型,其中,预测模型是频谱特征和调域值建立的映射关系;输入待检测频谱特征利用预测模型获得待检测调域值,其中,待检测调域值与待检测频谱特征相对应,待检测频谱特征是从话者的待预测语音中截取的方式。本发明解决了现有技术在用户不确定情况下需要较长的输入语音样本来估计调域而导致的准确率和速度都较低的技术问题。
-
-
-
-