粤剧音频修复方法、装置、设备及介质

    公开(公告)号:CN118098252A

    公开(公告)日:2024-05-28

    申请号:CN202311764705.6

    申请日:2023-12-20

    Abstract: 本申请涉及一种粤剧音频修复方法、装置、设备及介质,方法包括:获取待修复粤剧音频片段信号;基于特征工程对粤剧音频片段信号进行高维嵌入,在特征空间中采用短时傅立叶变换谱将粤剧音频片段信号转化为高维特征信号;调用预训练的粤剧音频修复模型,将高维特征信号输入至粤剧音频修复模型,以concat连接方式融合初始状态的纯噪声特征信号,采用模型中同一个生成器的复用逐渐进行逆扩散,以不断消除特征信号的噪声,直至输出修复后的高维特征信号;进行逆向特征工程,将生成的修复后高维特征信号转化为音频信号,输出修复后的粤剧音频信号,以完成粤剧音频的修复。本申请能够节约了大量的人力资源成本,大大提高了粤剧音频修复的工作效率。

Patent Agency Ranking