Patent search ap:("北京语言大学") AND inv:"钟辉航" Page 1

1.

发明公开
基于大语言模型的发音偏误检测及动作反馈方法及系统审中-公开

公开(公告)号：CN116805495A

公开(公告)日：2023-09-26

申请号：CN202311039410.2

申请日：2023-08-17

Applicant: 北京语言大学

Inventor： 解焱陆 , 钟辉航

IPC: G10L25/51 , G10L25/27 , G09B5/04

Abstract: 本发明提供一种基于大语言模型的发音偏误检测及动作反馈方法及系统，涉及发音偏误检测领域，包括：获取跟读文本的二语发音偏误数据集进行音素标注；将标注后的数据集以及跟读文本对应音素发送至gtp4，调用gtp4的API获得任意数量的跟读文本的发音动作反馈数据集；基于发音动作反馈数据集，获得发音动作反馈微调大语言模型，输入任意跟读文本至发音动作反馈微调大语言模型，完成基于大语言模型的发音偏误检测及动作反馈。可以实现对任意跟读文本的发音动作反馈，用于微调大语言模型的数据集可以自动获得。解决了现有人力成本高，且只能针对限定跟读文本的不足之处，并且由于反馈结果都是基于真实音素的反馈，比基于统计的方法得到的反馈信息更加有效。

2.

发明授权
基于大语言模型的发音偏误检测及动作反馈方法及系统有权

公开(公告)号：CN116805495B

公开(公告)日：2023-11-21

申请号：CN202311039410.2

申请日：2023-08-17

Applicant: 北京语言大学

Inventor： 解焱陆 , 钟辉航

IPC: G10L25/51 , G10L25/27 , G09B5/04

3.

发明授权
一种大模型发音偏误检测及发音动作图像反馈方法及装置有权

公开(公告)号：CN118072761B

公开(公告)日：2024-10-18

申请号：CN202410139244.1

申请日：2024-01-31

Applicant: 北京语言大学

Inventor： 解焱陆 , 钟辉航

IPC: G10L25/51 , G10L15/06 , G10L15/02 , G06F16/36 , G06F16/33 , G06T11/00 , G06N5/022

Abstract: 本发明涉及计算机辅助语音教学技术领域，特别是指一种大模型发音偏误检测及发音动作图像反馈方法及装置，包括：将二语学习者音频输入至发音偏误模型中，输出二语学习者的实际音素序列；对实际音素序列进行错误识别处理；通过知识图谱对错误发音进行对应正确发音的搜索，获得反馈信息；将反馈信息输入至大语言模型中，获得反馈文本；基于正确发音的口型图片通过图生图技术生成对应的发音口型图像；将反馈文本和发音口型图像综合反馈给二语学习者。本发明的广泛适用性使其成为一种更为灵活和全面的学习工具。传统方案往往受限于特定跟读文本的范围，而本发明不受文本类型和内容的限制，为二语学习者提供了更加个性化和广泛的学习支持。

4.

发明公开
一种大模型发音偏误检测及发音动作图像反馈方法及装置有权

公开(公告)号：CN118072761A

公开(公告)日：2024-05-24

申请号：CN202410139244.1

申请日：2024-01-31

Applicant: 北京语言大学

Inventor： 解焱陆 , 钟辉航

IPC: G10L25/51 , G10L15/06 , G10L15/02 , G06F16/36 , G06F16/33 , G06T11/00 , G06N5/022

Abstract: 本发明涉及计算机辅助语音教学技术领域，特别是指一种大模型发音偏误检测及发音动作图像反馈方法及装置，包括：将二语学习者音频输入至发音偏误模型中，输出二语学习者的实际音素序列；对实际音素序列进行错误识别处理；通过知识图谱对错误发音进行对应正确发音的搜索，获得反馈信息；将反馈信息输入至大语言模型中，获得反馈文本；基于正确发音的口型图片通过图生图技术生成对应的发音口型图像；将反馈文本和发音口型图像综合反馈给二语学习者。本发明的广泛适用性使其成为一种更为灵活和全面的学习工具。传统方案往往受限于特定跟读文本的范围，而本发明不受文本类型和内容的限制，为二语学习者提供了更加个性化和广泛的学习支持。

Patent Agency Ranking