一种利用发音属性和参考文本的发音偏误检测方法及装置

    公开(公告)号:CN114999526A

    公开(公告)日:2022-09-02

    申请号:CN202210466983.2

    申请日:2022-04-29

    Inventor: 解焱陆 陈琪

    Abstract: 本发明公开了一种利用发音属性和参考文本的发音偏误检测方法及装置,所述方法包括:提取二语学习者语音帧的发音属性,得到第一发音属性序列;将参考文本中的标准音素序列映射到发音属性,得到第二发音属性序列;采用逐块注意力机制,将第一发音属性序列和第二发音属性序列进行分块对齐;对齐后提取音素向量,并与声学特征和发音特征拼接后作为检测模型的输入,进行发音偏误检测。本发明在发音偏误检测任务中加入参考文本信息,采用逐块注意力机制,利用发音属性作为约束条件将参考文本和二语学习者的语音分块对齐,利用参考文本中有效信息的同时避免了引入误导性信息和造成对误发音的错误接受,提升了系统音素识别能力和发音偏误检测能力。

    一种利用发音属性和参考文本的发音偏误检测方法及装置

    公开(公告)号:CN114999526B

    公开(公告)日:2023-03-21

    申请号:CN202210466983.2

    申请日:2022-04-29

    Inventor: 解焱陆 陈琪

    Abstract: 本发明公开了一种利用发音属性和参考文本的发音偏误检测方法及装置,所述方法包括:提取二语学习者语音帧的发音属性,得到第一发音属性序列;将参考文本中的标准音素序列映射到发音属性,得到第二发音属性序列;采用逐块注意力机制,将第一发音属性序列和第二发音属性序列进行分块对齐;对齐后提取音素向量,并与声学特征和发音特征拼接后作为检测模型的输入,进行发音偏误检测。本发明在发音偏误检测任务中加入参考文本信息,采用逐块注意力机制,利用发音属性作为约束条件将参考文本和二语学习者的语音分块对齐,利用参考文本中有效信息的同时避免了引入误导性信息和造成对误发音的错误接受,提升了系统音素识别能力和发音偏误检测能力。

Patent Agency Ranking