一种基于音素对迭代融合的多语种音素识别方法
Abstract:
本发明涉及一种基于音素对迭代融合的多语种音素识别方法,属于音频信号处理技术领域。获取并通过多语言国际音标转化来有效利用有差别资源度的多语种音素资源,统一映射到直接获取语言的数据集进行非映射IPA音素簇扩充之后,重建的新数据集取代传统单一通用数据集以用于融合音素集。以人体声道发声为约束,构造人体发音共振约束的音素高阶线性预测峰值频带语音学特征,将此语音学特征结合声学特征MFCC融合成新型的音素区分性特征。通过最小同现音素对迭代缩减算法或音素特征余弦相似对迭代缩减算法。最后,基于融合完备音素集构建多语言音素标签,提取标签语言训练集与测试集的新型音素区分性特征,实现可变长语音自动对齐的音素识别。
Public/Granted literature
Patent Agency Ranking
0/0