基于拾音环境因素采集的音频数据增强方法、装置及介质

    公开(公告)号:CN118737172A

    公开(公告)日:2024-10-01

    申请号:CN202411005494.2

    申请日:2024-07-25

    Applicant: 武汉大学

    Inventor: 任延珍 王绍宇

    Abstract: 本发明公开了一种基于拾音环境因素采集的音频数据增强方法、装置及介质,获取待增强的原始音频数据的样本训练集;对所述样本训练集依次进行分批、验证、标签提取、合并操作;调度拾音器和扬声器在真实环境中对每个样本批次的整条音频数据混合拾音环境因素;对整段录音数据根据所述分批和所述标签提取的相应数据依次进行切分和标记,得到当前样本批次的增强样本训练集;获取每个样本批次的增强样本训练集,拼接得到最终的原始音频数据的增强样本训练集。优点:本发明同时考虑到了环境背景噪声,拾音器与声源之间的距离和拾音器内部产生的干扰等环境因素,更能有效引入环境信息,进而提高声音事件检测模型在真实环境中的准确率,减少性能下降。

Patent Agency Ranking