一种基于改进Tacotron2模型的中文音节语音合成方法与系统

    公开(公告)号:CN119049448B

    公开(公告)日:2025-03-25

    申请号:CN202411555105.3

    申请日:2024-11-04

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于改进Tacotron2模型的中文音节语音合成方法与系统,涉及语音合成技术领域,方法包括如下步骤:构建并训练中文音节语音合成模型;将待合成的音素音频输入训练好的中文音节语音合成模型以实现语音合成;所述中文音节语音合成模型包括:音节音频初始嵌入模块,编码模块、注意力感知模块、预网络、注意力模块、解码模块、后置网络层和线性频谱转换层。本发明可利用声韵母音频合成未有汉字载体的中文音节发音的音频,通过这种方法,即使某些发音没有对应的汉字也能够通过组合声母、韵母和声调来合成相应的音节,这不仅能够丰富中文语音合成的技术和应用,还能够为语言学研究提供新的工具和视角。

    基于偏误字典和序列对齐的中文口音偏误评估方法与系统

    公开(公告)号:CN119418691A

    公开(公告)日:2025-02-11

    申请号:CN202510005682.3

    申请日:2025-01-03

    Applicant: 华侨大学

    Abstract: 本发明公开了基于偏误字典和序列对齐的中文口音偏误评估方法与系统,涉及文本分析技术领域,方法包括如下步骤:采集评估对象朗读标准音素文本的语音信号,识别生成待评估音素文本;对比待评估音素文本和标准音素文本,构建口音偏误字典;基于口音偏误字典计算待评估音素文本和标准音素文本的编辑距离;基于编辑距离评估该评估对象的口音偏误。本发明构建了一个详尽的口音偏误字典,在此基础上利用Levenshtein序列对齐算法进行待评估文本与标准文本的编辑距离计算,再基于字典统计字典偏误编辑距离以及其它错误编辑距离;通过对这两个距离进行加权向量得到了一个综合的偏误量化得分,该得分能够更准确地反映学习者的口音偏误程度。

    一种等级标准语法点检测方法、装置、设备及存储介质

    公开(公告)号:CN117952088A

    公开(公告)日:2024-04-30

    申请号:CN202410089874.2

    申请日:2024-01-22

    Applicant: 华侨大学

    Abstract: 本发明提供一种等级标准语法点检测方法、装置、设备及存储介质,首先构建等级标准语法库,将等级标准语法大纲进行结构化划分,将等级标准的语法点内容与对应语法点编号组合分成各语法点列表集;将待检测文本进行分词,将分词结果依次与所述等级标准语法库进行语法点检测匹配,将获得的语法点检测匹配结果存入命中语法点列表;输出命中语法点列表,即为待测文本的等级标准语法匹配命中的检测结果。本发明结合自然语言处理技术与正则规则,构建等级标准语法库,实现文本从词语、固定搭配、模式、词性、短语、句法依存、语义这7个层面进行智能语法点检测,为自然语言处理和智适应教学的研究等方面带来积极的影响。

    基于偏误字典和序列对齐的中文口音偏误评估方法与系统

    公开(公告)号:CN119418691B

    公开(公告)日:2025-04-29

    申请号:CN202510005682.3

    申请日:2025-01-03

    Applicant: 华侨大学

    Abstract: 本发明公开了基于偏误字典和序列对齐的中文口音偏误评估方法与系统,涉及文本分析技术领域,方法包括如下步骤:采集评估对象朗读标准音素文本的语音信号,识别生成待评估音素文本;对比待评估音素文本和标准音素文本,构建口音偏误字典;基于口音偏误字典计算待评估音素文本和标准音素文本的编辑距离;基于编辑距离评估该评估对象的口音偏误。本发明构建了一个详尽的口音偏误字典,在此基础上利用Levenshtein序列对齐算法进行待评估文本与标准文本的编辑距离计算,再基于字典统计字典偏误编辑距离以及其它错误编辑距离;通过对这两个距离进行加权向量得到了一个综合的偏误量化得分,该得分能够更准确地反映学习者的口音偏误程度。

    基于偏移和卷积自适应的非母语中文语音识别方法与系统

    公开(公告)号:CN119252235B

    公开(公告)日:2025-02-25

    申请号:CN202411783635.3

    申请日:2024-12-06

    Applicant: 华侨大学

    Abstract: 本发明公开了基于偏移和卷积自适应的非母语中文语音识别方法与系统,涉及语音识别技术领域,方法包括以下步骤:选择预训练模型,添加TBA模块和卷积自适应模块构成非母语中文语音识别模型;利用训练好的非母语中文语音识别模型实现非母语中文语音识别;TBA模块根据语音帧生成重要性权重和偏置项,并输出偏置向量到前馈层;卷积自适应模块将表示向量转换为特征加权向量。本发明结合TBA和卷积自适应模块,提高了模型对语音token重要性的理解以及有效提取编码知识,这种技术组合不仅增强了模型的识别准确性,还提升了其在多语言环境或全球化应用中的适应性,在非母语中文语音识别任务中展现出显著的有益效果。

    基于偏移和卷积自适应的非母语中文语音识别方法与系统

    公开(公告)号:CN119252235A

    公开(公告)日:2025-01-03

    申请号:CN202411783635.3

    申请日:2024-12-06

    Applicant: 华侨大学

    Abstract: 本发明公开了基于偏移和卷积自适应的非母语中文语音识别方法与系统,涉及语音识别技术领域,方法包括以下步骤:选择预训练模型,添加TBA模块和卷积自适应模块构成非母语中文语音识别模型;利用训练好的非母语中文语音识别模型实现非母语中文语音识别;TBA模块根据语音帧生成重要性权重和偏置项,并输出偏置向量到前馈层;卷积自适应模块将表示向量转换为特征加权向量。本发明结合TBA和卷积自适应模块,提高了模型对语音token重要性的理解以及有效提取编码知识,这种技术组合不仅增强了模型的识别准确性,还提升了其在多语言环境或全球化应用中的适应性,在非母语中文语音识别任务中展现出显著的有益效果。

    一种基于改进Tacotron2模型的中文音节语音合成方法与系统

    公开(公告)号:CN119049448A

    公开(公告)日:2024-11-29

    申请号:CN202411555105.3

    申请日:2024-11-04

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于改进Tacotron2模型的中文音节语音合成方法与系统,涉及语音合成技术领域,方法包括如下步骤:构建并训练中文音节语音合成模型;将待合成的音素音频输入训练好的中文音节语音合成模型以实现语音合成;所述中文音节语音合成模型包括:音节音频初始嵌入模块,编码模块、注意力感知模块、预网络、注意力模块、解码模块、后置网络层和线性频谱转换层。本发明可利用声韵母音频合成未有汉字载体的中文音节发音的音频,通过这种方法,即使某些发音没有对应的汉字也能够通过组合声母、韵母和声调来合成相应的音节,这不仅能够丰富中文语音合成的技术和应用,还能够为语言学研究提供新的工具和视角。

    一种中文口音识别方法、装置、设备及介质

    公开(公告)号:CN117475999A

    公开(公告)日:2024-01-30

    申请号:CN202311434355.7

    申请日:2023-10-31

    Applicant: 华侨大学

    Abstract: 本发明提供了一种中文口音识别方法、装置、设备及介质,涉及口音识别技术领域,能够识别非母语人群的口音。首先,语音信号输入Wave2vec2.0预训练模型抽取编码器的深层隐藏层进行拼接,得到层次化聚合向量。然后,将层次化聚合向量输入到注意力统计池化网络,根据注意力权重计算统计特征均值和统计特征方差,两者拼接得到紧凑的聚合口音特征。最后,聚合口音特征输入到LSTM网络中学习语音序列的长期依赖关系,获得口音依赖特征,将口音依赖特征输入全连接分类器实现口音分类。利用语音预训练模型提取更高层次的语义信息,并利用注意力统计池化捕捉语音特征在时间上的变化和分布,有效地提取口音特征并增强口音特征的判别性。

Patent Agency Ranking