Patent search ap:("北京语言大学") AND inv:"付凯奇" Page 1

1.

发明公开
发音偏误检测方法、装置、计算机设备和存储介质审中-实审

公开(公告)号：CN114283852A

公开(公告)日：2022-04-05

申请号：CN202111004261.7

申请日：2021-08-30

Applicant: 腾讯科技(深圳)有限公司 , 北京语言大学

Inventor： 张劲松 , 付凯奇 , 彭霖铠 , 解焱陆 , 林炳怀 , 王丽园

IPC: G10L25/60 , G10L15/26

Abstract: 本申请涉及一种发音偏误检测方法、装置、计算机设备和存储介质。所述方法包括：获取语音信息以及语音信息对应的标准发音文本信息；根据语音信息和标准发音文本信息进行语音识别，获得语音信息对应的预测发音文本信息；根据预测发音文本信息和标准发音文本信息，对语音信息的发音偏误进行检测。采用本方法能够提升发音偏误检测准确性。

2.

发明公开
发音检测方法、装置及计算机可读介质审中-实审

公开(公告)号：CN113409768A

公开(公告)日：2021-09-17

申请号：CN202011119857.7

申请日：2020-10-19

Applicant: 腾讯科技(深圳)有限公司 , 北京语言大学

Inventor： 付凯奇 , 林炳怀 , 张劲松 , 解焱陆 , 冯晓莉 , 王丽园

IPC: G10L15/02 , G10L25/78 , G10L25/51 , G10L25/60

Abstract: 本申请的实施例基于人工智能中的语音技术和机器学习方法，提供了一种发音检测方法、装置及计算机可读介质。该发音检测方法包括：从待检测的语音音频中提取音频帧特征；基于所述音频帧特征与预设第一语言中的第一语音音素之间的匹配度，生成第一后验概率，并基于所述音频帧特征与预设第二语言中的第二语音音素之间的匹配度，生成第二后验概率；对所述第一后验概率和所述第二后验概率进行神经网络回归处理，生成所述语音音频中的音素对应于第二语言音素的概率得分。本申请实施例的技术方案可以得到精确的发音检测结果，提高发音检测的精确性和发音者的练习效率。

3.

发明授权
一种基于发音属性的发音人国别识别模型建模方法及系统有权

公开(公告)号：CN110428803B

公开(公告)日：2020-04-28

申请号：CN201910662424.7

申请日：2019-07-22

Applicant: 北京语言大学

Inventor： 解焱陆 , 郭铭昊 , 张劲松 , 于嘉威 , 付凯奇

IPC: G10L15/00 , G10L15/02 , G10L15/04 , G10L15/06 , G10L15/14 , G10L25/18 , G10L25/30 , G10L25/93

Abstract: 本发明提供一种基于发音属性的发音人国别识别模型建模方法及系统，包括：将汉语音段划分成多种发音属性类别；针对划分出的每一发音属性类别分别进行建模，并利用大规模普通话语料库作为训练数据集进行训练，得到多个发音属性特征提取器；将参与后续国别识别任务的所有二语语料输入各发音属性特征提取器中，对应每一帧语音的多个不同的发音属性，得到多组不同维度的发音属性特征；将各发音属性特征对应的属性后验概率进行拼接，得到每帧的发音属性超向量；使用发音属性超向量训练深度神经网络得到第一国别识别模型。本发明的国别识别方法识别准确率高，且采用本发明方法不需考虑发音人所说内容，也不需考虑当前所说的语言种类，都可识别出其国别。

4.

发明授权
发音偏误检测方法、装置及存储介质有权

公开(公告)号：CN113327595B

公开(公告)日：2022-08-02

申请号：CN202110667154.6

申请日：2021-06-16

Applicant: 北京语言大学

Inventor： 张劲松 , 彭霖铠 , 付凯奇 , 解焱陆 , 柯登峰

IPC: G10L15/06 , G10L15/02 , G10L15/16 , G10L15/187 , G10L25/30 , G10L25/51

Abstract: 本发明提供了一种发音偏误检测方法、装置及存储介质，所述方法包括构建语音预训练模型，并基于无标注语音语料库对所述语音预训练模型进行预训练；在所述语音预训练模型上添加一层随机初始化的全连接层，得到微调预训练模型，并使用带标注的发音偏误数据对所述微调预训练模型进行训练，得到发音偏误检测模型；利用所述发音偏误检测模型对学习者的语音进行检测，以获得发音偏误信息。本发明所述发音偏误检测方法、装置及存储介质，通过构建语音预训练模型、微调预训练模型，利用发音偏误检测模型对学习者的语音进行检测以获得发音偏误信息的方式，使得在缺少发音训练数据情况下，依然可以有效提升发音偏误检测系统的性能。

5.

发明公开
发音偏误检测方法、装置及存储介质有权

公开(公告)号：CN113327595A

公开(公告)日：2021-08-31

申请号：CN202110667154.6

申请日：2021-06-16

Applicant: 北京语言大学

Inventor： 张劲松 , 彭霖铠 , 付凯奇 , 解焱陆 , 柯登峰

IPC: G10L15/06 , G10L15/02 , G10L15/16 , G10L15/187 , G10L25/30 , G10L25/51

Abstract: 本发明提供了一种发音偏误检测方法、装置及存储介质，所述方法包括构建语音预训练模型，并基于无标注语音语料库对所述语音预训练模型进行预训练；在所述语音预训练模型上添加一层随机初始化的全连接层，得到微调预训练模型，并使用带标注的发音偏误数据对所述微调预训练模型进行训练，得到发音偏误检测模型；利用所述发音偏误检测模型对学习者的语音进行检测，以获得发音偏误信息。本发明所述发音偏误检测方法、装置及存储介质，通过构建语音预训练模型、微调预训练模型，利用发音偏误检测模型对学习者的语音进行检测以获得发音偏误信息的方式，使得在缺少发音训练数据情况下，依然可以有效提升发音偏误检测系统的性能。

6.

发明公开
一种基于发音属性的发音人国别识别方法及系统有权

公开(公告)号：CN110428803A

公开(公告)日：2019-11-08

申请号：CN201910662424.7

申请日：2019-07-22

Applicant: 北京语言大学

Inventor： 解焱陆 , 郭铭昊 , 张劲松 , 于嘉威 , 付凯奇

IPC: G10L15/00 , G10L15/02 , G10L15/04 , G10L15/06 , G10L15/14 , G10L25/18 , G10L25/30 , G10L25/93

Abstract: 本发明提供一种基于发音属性的发音人国别识别方法及系统，包括：将汉语音段划分成多种发音属性类别；针对划分出的每一发音属性类别分别进行建模，并利用大规模普通话语料库作为训练数据集进行训练，得到多个发音属性特征提取器；将参与后续国别识别任务的所有二语语料输入各发音属性特征提取器中，对应每一帧语音的多个不同的发音属性，得到多组不同维度的发音属性特征；将各发音属性特征对应的属性后验概率进行拼接，得到每帧的发音属性超向量；使用发音属性超向量训练深度神经网络得到第一国别识别模型。本发明的国别识别方法识别准确率高，且采用本发明方法不需要考虑发音人所说的内容，也不需要考虑当前所说的语言种类，都可以识别出其国别。

Patent Agency Ranking