-
公开(公告)号:CN108630192A
公开(公告)日:2018-10-09
申请号:CN201710156620.8
申请日:2017-03-16
Applicant: 清华大学 , 同方鼎欣科技股份有限公司
Abstract: 本发明涉及一种非汉语语音识别方法、系统及其构造方法,非汉语语音识别的构造方法包括:利用汉语特征提取模型从汉语语料库的汉语语音数据中提取语音特征;根据提取的语音特征建立汉语声学模型;对汉语声学模型进行处理,得到的非汉语声学模型;对汉语特征提取模型进行处理,得到非汉语特征提取模型;根据非汉语特征提取模型和非汉语声学模型构建非汉语语音识别系统。本发明利用既有的汉语语音资源及其训练出的模型,以及少量必须的语言数据资源就可以快捷地构造出有效的非汉语语音识别系统,有效的降低了成本和时间开销。
-
公开(公告)号:CN108630192B
公开(公告)日:2020-06-26
申请号:CN201710156620.8
申请日:2017-03-16
Applicant: 清华大学 , 同方鼎欣科技股份有限公司
Abstract: 本发明涉及一种非汉语语音识别方法、系统及其构造方法,非汉语语音识别的构造方法包括:利用汉语特征提取模型从汉语语料库的汉语语音数据中提取语音特征;根据提取的语音特征建立汉语声学模型;对汉语声学模型进行处理,得到的非汉语声学模型;对汉语特征提取模型进行处理,得到非汉语特征提取模型;根据非汉语特征提取模型和非汉语声学模型构建非汉语语音识别系统。本发明利用既有的汉语语音资源及其训练出的模型,以及少量必须的语言数据资源就可以快捷地构造出有效的非汉语语音识别系统,有效的降低了成本和时间开销。
-
公开(公告)号:CN105336323B
公开(公告)日:2018-12-28
申请号:CN201510662027.1
申请日:2015-10-14
Applicant: 清华大学
IPC: G10L15/00 , G10L15/06 , G10L15/065 , G10L25/39
Abstract: 本申请提供了一种维语语音识别的方法和装置,包括:将维语语音帧对应的声学特征作为自适应声学模型中的汉语声学模型的参数输入,经过线性变换和非线性变换将所述汉语声学模型下的维语语音帧对应的声学特征变换到汉语声学模型的高维非线性特征空间分布;将所述维语语音帧对应的汉语声学模型的高维非线性特征空间分布作为自适应声学模型中的维语声学模型的参数输入到所述维语声学模型中,训练所述维语声学模型,获得重构的自适应声学模型;使用遗传算法或者穷举算法筛选所述重构的自适应声学模型,获得最优自适应声学模型;使用所述最优自适应声学模型进行维语语音的识别,从而解决了维语语料不足和语音识别准确率低的问题。
-
公开(公告)号:CN105336323A
公开(公告)日:2016-02-17
申请号:CN201510662027.1
申请日:2015-10-14
Applicant: 清华大学
IPC: G10L15/00 , G10L15/06 , G10L15/065 , G10L25/39
CPC classification number: G10L15/005 , G10L15/063 , G10L15/065 , G10L25/39
Abstract: 本申请提供了一种维语语音识别的方法和装置,包括:将维语语音帧对应的声学特征作为自适应声学模型中的汉语声学模型的参数输入,经过线性变换和非线性变换将所述汉语声学模型下的维语语音帧对应的声学特征变换到汉语声学模型的高维非线性特征空间分布;将所述维语语音帧对应的汉语声学模型的高维非线性特征空间分布作为自适应声学模型中的维语声学模型的参数输入到所述维语声学模型中,训练所述维语声学模型,获得重构的自适应声学模型;使用遗传算法或者穷举算法筛选所述重构的自适应声学模型,获得最优自适应声学模型;使用所述最优自适应声学模型进行维语语音的识别,从而解决了维语语料不足和语音识别准确率低的问题。
-
-
-