一种基于音素对迭代融合的多语种音素识别方法

Invention Grant

CN115512689B 一种基于音素对迭代融合的多语种音素识别方法有权

Please log in to see more content

Patent Title: 一种基于音素对迭代融合的多语种音素识别方法
Application No.: CN202211106527.3

Application Date: 2022-09-12
Publication No.: CN115512689B

Publication Date: 2025-04-25
Inventor: 龙华 , 苏树盟 , 邵玉斌 , 杜庆治 , 黄张衡 , 段云
Applicant: 昆明理工大学
Applicant Address: 云南省昆明市五华区学府路253号
Assignee: 昆明理工大学
Current Assignee: 昆明理工大学
Current Assignee Address: 云南省昆明市五华区学府路253号
Agency: 昆明明润知识产权代理事务所
Agent 王鹏飞
Main IPC: G10L15/02
IPC: G10L15/02 ; G10L19/02 ; G10L25/18 ; G10L25/27 ; G10L25/93

Abstract:

本发明涉及一种基于音素对迭代融合的多语种音素识别方法，属于音频信号处理技术领域。获取并通过多语言国际音标转化来有效利用有差别资源度的多语种音素资源，统一映射到直接获取语言的数据集进行非映射IPA音素簇扩充之后，重建的新数据集取代传统单一通用数据集以用于融合音素集。以人体声道发声为约束，构造人体发音共振约束的音素高阶线性预测峰值频带语音学特征，将此语音学特征结合声学特征MFCC融合成新型的音素区分性特征。通过最小同现音素对迭代缩减算法或音素特征余弦相似对迭代缩减算法。最后，基于融合完备音素集构建多语言音素标签，提取标签语言训练集与测试集的新型音素区分性特征，实现可变长语音自动对齐的音素识别。

Public/Granted literature

CN115512689A 一种基于音素对迭代融合的多语种音素识别方法 Public/Granted day:2022-12-23

Information query

Chinese Patent Announcement Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）
G10L15/02	.语音识别的特征提取；识别单位的选择