汉语音字转换方法及系统、区分性词典的构建方法

    公开(公告)号:CN102750267B

    公开(公告)日:2015-02-25

    申请号:CN201210202471.1

    申请日:2012-06-15

    Abstract: 本发明实施例提供一种汉语音字转换方法以及系统、区分性词典的构建方法;所述汉语音字转换方法包括:根据输入的拼音串以及预先构建的区分性词典,生成与所述拼音串对应的字词网格;其中所述区分性词典基于文本与拼音的互信息而构建;根据统计语言模型对所述字词网格进行解码,得到概率最大的转换路径以实现汉语音字的转换。通过本发明实施例,可以进一步提高音字转换的正确率。

    一种汉语语音训练系统及汉语语音训练方法

    公开(公告)号:CN102968921B

    公开(公告)日:2014-12-10

    申请号:CN201210436374.9

    申请日:2012-11-05

    Abstract: 本发明提供一种汉语语音训练系统及汉语语音训练方法,该系统包括;连续统设计模块获取用户根据被试者的感知偏误和已有的汉语语音理论设计出的有针对性的声学连续统;合成语音模块将连续统设计模块设计完的声学连续统转化成合成语音;中国人感知常模模块通过中国人对合成语音进行听辨,获取的对声学连续统的中国人感知常模;音节结构设计模块获取用户找到针对被试者水平的音节结构,设计出的训练顺序;自然语音语料库模块按照音节结构设计模块设计的训练顺序,抽取出所需的自然语音语料;训练模块利用所述自然语音语料和所述中国人感知常模,供被试者进行汉语语音训练。其使留学生能够在短时间内掌握汉语语音间的主要区别,迅速提高听辨正确率。

    利用语音进行座席筛选的方法及系统

    公开(公告)号:CN102802114A

    公开(公告)日:2012-11-28

    申请号:CN201210210943.8

    申请日:2012-06-20

    Inventor: 解焱陆 张劲松

    Abstract: 本发明实施例提供了一种利用语音进行座席筛选的方法及系统,所述的方法包括:接收用户传送的语音信息;从所述的语音信息中提取对应的短时能量、基音、谱参数;根据所述的短时能量、基音、谱参数从预先设定的座席集中筛选出与所述的语音信息对应的座席。通过对用户语音进行分析,提取语义信息、身份信息、情绪特征、语言信息、年龄、性别特征,并根据此信息选择座席,无须使用IVR菜单进行用户手动选择座席,提升了用户对业务的使用体验,减少了等待时间,同时也减少了系统资源的浪费。

    一种大模型发音偏误检测及发音动作图像反馈方法及装置

    公开(公告)号:CN118072761B

    公开(公告)日:2024-10-18

    申请号:CN202410139244.1

    申请日:2024-01-31

    Inventor: 解焱陆 钟辉航

    Abstract: 本发明涉及计算机辅助语音教学技术领域,特别是指一种大模型发音偏误检测及发音动作图像反馈方法及装置,包括:将二语学习者音频输入至发音偏误模型中,输出二语学习者的实际音素序列;对实际音素序列进行错误识别处理;通过知识图谱对错误发音进行对应正确发音的搜索,获得反馈信息;将反馈信息输入至大语言模型中,获得反馈文本;基于正确发音的口型图片通过图生图技术生成对应的发音口型图像;将反馈文本和发音口型图像综合反馈给二语学习者。本发明的广泛适用性使其成为一种更为灵活和全面的学习工具。传统方案往往受限于特定跟读文本的范围,而本发明不受文本类型和内容的限制,为二语学习者提供了更加个性化和广泛的学习支持。

    一种大模型发音偏误检测及发音动作图像反馈方法及装置

    公开(公告)号:CN118072761A

    公开(公告)日:2024-05-24

    申请号:CN202410139244.1

    申请日:2024-01-31

    Inventor: 解焱陆 钟辉航

    Abstract: 本发明涉及计算机辅助语音教学技术领域,特别是指一种大模型发音偏误检测及发音动作图像反馈方法及装置,包括:将二语学习者音频输入至发音偏误模型中,输出二语学习者的实际音素序列;对实际音素序列进行错误识别处理;通过知识图谱对错误发音进行对应正确发音的搜索,获得反馈信息;将反馈信息输入至大语言模型中,获得反馈文本;基于正确发音的口型图片通过图生图技术生成对应的发音口型图像;将反馈文本和发音口型图像综合反馈给二语学习者。本发明的广泛适用性使其成为一种更为灵活和全面的学习工具。传统方案往往受限于特定跟读文本的范围,而本发明不受文本类型和内容的限制,为二语学习者提供了更加个性化和广泛的学习支持。

    一种确定学习者发音的不确定性的方法及装置

    公开(公告)号:CN115083437A

    公开(公告)日:2022-09-20

    申请号:CN202210535600.2

    申请日:2022-05-17

    Abstract: 本发明涉及发音质量评估技术领域,特别是指一种确定学习者发音的不确定性的方法及装置。方法包括:获取学习者的发音数据;基于所述学习者的发音数据,获取基准测听数据;基于所述学习者的发音数据以及所述基准测听数据,构建所述学习者的音素混淆矩阵,根据所述学习者的音素混淆矩阵,确定所述学习者的发音的不确定性。采用本发明,可以对学习者发音的不确定性进行量化,并且对不同音素发音的不确定性进行单一向量的对比研究。

    一种利用发音属性和参考文本的发音偏误检测方法及装置

    公开(公告)号:CN114999526A

    公开(公告)日:2022-09-02

    申请号:CN202210466983.2

    申请日:2022-04-29

    Inventor: 解焱陆 陈琪

    Abstract: 本发明公开了一种利用发音属性和参考文本的发音偏误检测方法及装置,所述方法包括:提取二语学习者语音帧的发音属性,得到第一发音属性序列;将参考文本中的标准音素序列映射到发音属性,得到第二发音属性序列;采用逐块注意力机制,将第一发音属性序列和第二发音属性序列进行分块对齐;对齐后提取音素向量,并与声学特征和发音特征拼接后作为检测模型的输入,进行发音偏误检测。本发明在发音偏误检测任务中加入参考文本信息,采用逐块注意力机制,利用发音属性作为约束条件将参考文本和二语学习者的语音分块对齐,利用参考文本中有效信息的同时避免了引入误导性信息和造成对误发音的错误接受,提升了系统音素识别能力和发音偏误检测能力。

    可分离循环注意力的语音增强方法及装置

    公开(公告)号:CN114023346A

    公开(公告)日:2022-02-08

    申请号:CN202111285653.5

    申请日:2021-11-01

    Abstract: 本发明涉及一种可分离循环注意力的语音增强方法,包括步骤1:将语音信号输入至前置网络单元进行傅里叶变换,输出第一幅度流信号和第一相位流信号;步骤2:将所述第一幅度流信号和第一相位流信号输入注意力网络单元进行降噪,输出第二幅度流信号和第二相位流信号;所述注意力网络单元包括串联的多级极坐标注意力模块,每级极坐标注意力模块包括幅度注意力模块、相位自调节模块、相位它调节模块;步骤3:将所述第二幅度流信号和第二相位流信号输入至后置网络单元进行逆傅里叶变换,输出增强后的语音信号。本发明计算量小,能够有效保证语音降噪效果。

    发音检测方法、装置及计算机可读介质

    公开(公告)号:CN113409768A

    公开(公告)日:2021-09-17

    申请号:CN202011119857.7

    申请日:2020-10-19

    Abstract: 本申请的实施例基于人工智能中的语音技术和机器学习方法,提供了一种发音检测方法、装置及计算机可读介质。该发音检测方法包括:从待检测的语音音频中提取音频帧特征;基于所述音频帧特征与预设第一语言中的第一语音音素之间的匹配度,生成第一后验概率,并基于所述音频帧特征与预设第二语言中的第二语音音素之间的匹配度,生成第二后验概率;对所述第一后验概率和所述第二后验概率进行神经网络回归处理,生成所述语音音频中的音素对应于第二语言音素的概率得分。本申请实施例的技术方案可以得到精确的发音检测结果,提高发音检测的精确性和发音者的练习效率。

Patent Agency Ranking