一种海南方言语音识别系统及装置

    公开(公告)号:CN117577094A

    公开(公告)日:2024-02-20

    申请号:CN202311428936.X

    申请日:2023-10-31

    Abstract: 本发明涉及语音识别技术领域,公开了一种海南方言语音识别系统,包括特征提取模块和音素识别模块;特征提取模块通过对原始海南方言语音提取出各种语音特征,音素识别模块将所述语音特征依次通过卷积神经网络、残差网络、多头注意力机制以及长短期记忆网络组合而成的声学模型得到发音底层特征,通过全连接层映射到合适的维度,生成音素串;经过CTC损失函数计算预测的音素串与真实的音素串的差值,通过Ad‑am算法对模型中的参数进行优化,得到音素错误率;根据发音底层特征,利用海南方言发音底层特征进行方言语音识别。本发明能够有效提取不同方言特有的音素串发音底层特征,同时多种语音特征的融入使得方言语音识别性能得到大幅度提升。

    一种临高话和普通话混合语音识别模型训练方法及系统

    公开(公告)号:CN117373438A

    公开(公告)日:2024-01-09

    申请号:CN202311428942.5

    申请日:2023-10-31

    Abstract: 本发明涉及语音识别技术领域,公开了一种临高话和普通话混合语音识别模型训练方法,基于Conformer模型构建的端到端混合语音识别模型,所述方法包括:输入包含临高话和普通话的混合语音信号,并提取混合语音信号的声学特征序列;将特征序列输入到预设编码器,进行降采样以减少特征冗余信息,再经编码器编码生成隐藏向量;解码器对向量进行解码,在解码图中,依据转移弧上的权重逐帧进行搜索,计算每条路径中的权重得分;选择得分最高的路径作为最优路径,不断更新状态信息;输出最优路径对应的标签序列作为最终识别结果。本发明增强了模型提取局部细微特征的能力,提升了模型的语言建模能力,提高了模型识别的准确率。

Patent Agency Ranking