Invention Grant
- Patent Title: 一种基于端到端的水场景音频的生成方法
-
Application No.: CN201910091367.1Application Date: 2019-01-30
-
Publication No.: CN109936766BPublication Date: 2021-04-13
- Inventor: 刘世光 , 程皓楠 , 王凯
- Applicant: 天津大学
- Applicant Address: 天津市南开区卫津路92号
- Assignee: 天津大学
- Current Assignee: 天津大学
- Current Assignee Address: 天津市南开区卫津路92号
- Agency: 天津市北洋有限责任专利代理事务所
- Agent 潘俊达
- Main IPC: H04N21/439
- IPC: H04N21/439 ; G10L21/003

Abstract:
本发明属于音频处理的技术领域,具体涉及一种基于端到端的水场景音频的生成方法,包括如下步骤:步骤一,选取各类水场景视频,并进行预处理;步骤二,根据预处理后的数据,通过训练获得生成器模型;步骤三,将无声视频进行预处理,加载到训练好的生成器模型,输出与无声视频对应的音频;步骤四,根据音频的序列生成包络,并加载到训练好的音色增强器模型,输出音色增强后的音频。本发明能够实现端到端的户外水场景声音的自动生成,解决为场景配音费时和费力的问题,同时,利用训练所得的模型来生成水场景音频,能够提高生成速度和同步度,从而提高工作效率。
Public/Granted literature
- CN109936766A 一种基于端到端的水场景音频的生成方法 Public/Granted day:2019-06-25
Information query