一种基于端到端的水场景音频的生成方法
Abstract:
本发明属于音频处理的技术领域,具体涉及一种基于端到端的水场景音频的生成方法,包括如下步骤:步骤一,选取各类水场景视频,并进行预处理;步骤二,根据预处理后的数据,通过训练获得生成器模型;步骤三,将无声视频进行预处理,加载到训练好的生成器模型,输出与无声视频对应的音频;步骤四,根据音频的序列生成包络,并加载到训练好的音色增强器模型,输出音色增强后的音频。本发明能够实现端到端的户外水场景声音的自动生成,解决为场景配音费时和费力的问题,同时,利用训练所得的模型来生成水场景音频,能够提高生成速度和同步度,从而提高工作效率。
Public/Granted literature
Patent Agency Ranking
0/0