-
公开(公告)号:CN117135505A
公开(公告)日:2023-11-28
申请号:CN202311024620.4
申请日:2023-08-15
Applicant: 厦门大学
IPC: H04R1/08
Abstract: 本发明提供一种可适应不同混响环境的深度优化麦克风阵列增强方法,方法包括步骤:获取麦克风阵列的输入信号,获取波束形成信号,并提取环境混响特征;将环境混响特征输入训练好的混响感知模型,获得混响适配向量;基于混响适配向量,对波束形成信号进行反混响处理,将混响适配向量与环境混响特征进行卷积处理,获得后置滤波器系数;将后置滤波器系数于波束形成信号进行卷积处理,获得增强信号。该方法可通过实时获取混响环境特征,在深度学习神经网络框架下进行混响适配处理,并通过网络训练输出的适配向量与实时获取的混响环境特性组合后进行抗混响处理,显著降低了硬件侧信号运算的复杂度,方便了实际应用场景中的硬件工程实现。
-
公开(公告)号:CN117854533A
公开(公告)日:2024-04-09
申请号:CN202311053535.0
申请日:2023-08-21
Applicant: 厦门大学
IPC: G10L21/0216 , G10L25/30
Abstract: 本发明提出了一种可感知混响特性的深度网络驱动麦克风阵列语音增强方法及装置,包括:训练步骤,训练混响感知网络RSN;驱动步骤,将训练得到的网络模型参数部署到实现系统或者终端硬件侧,在获得目标声源方向后,对麦阵实时接收到的信号进行不同环境下混响感知BCC特征提取,将部署完成训练的RSN网络模型并生成对应不同环境的去混响波束形成系数,以卷积运算的方式作用于原始信号上得到抗混响增强信号。通过直接调用已完成训练的网络模型参数,以不同环境下实时混响感知BCC特征作为输入生成对应不同环境的去混响波束形成系数,以深度网络驱动的方式进行抗混响语音增强处理,因而计算复杂度低,易于在现场硬件平台部署并实时增强麦阵语音信号。
-
公开(公告)号:CN116978398A
公开(公告)日:2023-10-31
申请号:CN202310784625.0
申请日:2023-06-29
Applicant: 厦门大学
IPC: G10L21/0216 , G10L25/18 , G10L25/21 , G10L25/30 , G10K11/178
Abstract: 本发明提出了一种自适应抗混响的麦克风阵列语音增强方法及其系统,该方法包括如下步骤:训练与预存步骤,响应于利用不同混响数据训练获得不同混响条件下的抗混响滤波器系数,形成抗混响滤波器系数库并预先保存以待后续选用;估计与匹配步骤,对麦克风阵列实时接收到的信号进行混响特征提取,输入到混响程度分类器中进行估计,麦克风阵列根据估计结果选用预先保存的抗混响滤波器系数库,并在抗混响滤波器系数库中进行混响程度匹配选择调用合适的系数,将原始信号与经过混响程度匹配的抗混响滤波器系数进行抗混响滤波处理得到抗混响增强信号。本方法可在不同混响环境进行自适应抗混响处理,从而提高麦克风阵列在不同混响环境下的语音增强性能。
-
-