一种中文语音增强识别及文本纠错矫正方法

    公开(公告)号:CN115602161A

    公开(公告)日:2023-01-13

    申请号:CN202211295191.X

    申请日:2022-10-21

    Abstract: 本发明属于语音及文本处理领域,具体涉及一种中文语音增强识别及文本纠错矫正方法,包括:对待识别音频进行预处理,通过声纹模型进行特征提取并建立初始粗糙方言鉴别模型;建立初始网络模型对初始粗糙方言鉴别模型进行训练得到方言鉴别模型;基于N‑gram语言模型确定纠错候选分词集合;通过Bigram2元语言模型和N‑gram语言模型进行纠错矫正后输出文本。本发明对待识别音频进行预处理,减少语音识别干扰因素,采用GMM‑SVM模型提高了识别性能,采用GMM‑UBM模型和LSTM模型的组合模型建立初始网络模型拥有更快更好的训练拟合效果,通过N‑gram语言模型和Bigram2元语言模型进行文本处理纠错有效降低了错误率,优化了待识别音频转换成文本信息的结果。

Patent Agency Ranking