-
公开(公告)号:CN119673202A
公开(公告)日:2025-03-21
申请号:CN202510007105.8
申请日:2025-01-03
Applicant: 暨南大学
IPC: G10L25/30 , G10L21/003 , G06F18/214 , G06F16/61 , G06F18/213 , G06F18/21 , G06F18/22
Abstract: 本发明公开了基于数据蒸馏的语音转换模型的训练方法、系统及应用方法、系统。该方法组建语音训练数据集并利用语音训练数据集对原始语音转换模型进行训练,获得初始语音转换模型;组建语音评估数据集,将所述语音评估数据集输入初始语音转换模型,得到对应的每个说话人的转换语音数据;计算每个说话人的语音转换评分;判断每个说话人语音转换评分是否达到预设条件;若否,则将该说话人对应的语音数据从语音训练数据集中剔除,剩余的语音数据作为语音数据库;重复训练;将初始语音转换模型和语音数据库,作为分别作为训练好的语音转换模型和最终语音数据库。经该方法训练得出的语音转换模型和语音数据库,可以支持多种音色转换,语音转换效果好。
-
公开(公告)号:CN119479686A
公开(公告)日:2025-02-18
申请号:CN202510007602.8
申请日:2025-01-03
Applicant: 暨南大学
IPC: G10L25/30 , G10L21/003 , G10L25/24 , G06F18/213 , G06F18/214 , G06F18/22 , G06F18/25
Abstract: 本发明涉及人工智能技术领域,公开了一种基于流式匹配的歌声美化方法及系统,方法包括获取歌声数据和曲谱数据;从歌声数据中提取音色特征和音素后验概率图;根据曲谱数据和音素后验概率图,生成多维歌声表现力序列;根据多维歌声表现力序列、音素后验概率图和音色特征,生成语音梅尔谱;将语音梅尔谱输入声码器进行转换处理,得到经过美化后的歌声语音。本发明能够使输出的歌声语音在音准、音色和表现力上都得到优化,能够显著提升歌声的表现力和自然度,使生成的歌声质量更高,听感更加流畅以及富有表现力。
-