使用估计的空间参数的音频信号增强

    公开(公告)号:CN105900168A

    公开(公告)日:2016-08-24

    申请号:CN201480008591.5

    申请日:2014-01-22

    Abstract: 所接收的音频数据可包括第一组频率系数和第二组频率系数。可至少部分地基于所述第一组频率系数的至少一部分来估计用于所述第二组频率系数的至少一部分的空间参数。所估计的空间参数可应用于所述第二组频率系数以生成经修正的第二组频率系数。所述第一组频率系数可对应于第一频率范围(例如,单独通道频率范围),而所述第二组频率系数可对应于第二频率范围(例如,耦合通道频率范围)。复合耦合通道的组合频率系数可基于两个或更多个通道的频率系数。第一通道的频率系数与组合频率系数之间的互相关系数可被计算。

    不同信号维度的参数矢量的多级量化

    公开(公告)号:CN105324812A

    公开(公告)日:2016-02-10

    申请号:CN201480034435.6

    申请日:2014-06-17

    CPC classification number: G10L19/038 G10L19/008 H04N19/94

    Abstract: 第一矢量量化处理可被应用于N维参数集合的沿第一维度的两个或更多个参数值以产生第一组量化值。可至少部分地基于第一组量化值中的一个或多个值对于该N维参数集合的第二维度计算两个或更多个参数预测值。可至少部分地基于参数预测值计算预测残差值。第二矢量量化处理可被应用于该预测残差值以产生第二组量化值。这些处理可被扩展到任何数量的维度。对应的逆矢量量化处理可被执行。

    响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频

    公开(公告)号:CN118433628A

    公开(公告)日:2024-08-02

    申请号:CN202410510302.7

    申请日:2014-12-18

    Abstract: 本公开涉及响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频。在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。

    利用深度神经网络的自适应块切换

    公开(公告)号:CN116368497A

    公开(公告)日:2023-06-30

    申请号:CN202180070787.7

    申请日:2021-10-15

    Abstract: 本发明涉及一种用于通过以下操作预测表示自适应块长度媒体信号的频率内容的变换系数的方法:接收帧并接收指示所述帧中每个块的经量化变换系数的数量的块长度信息,所述经量化变换系数的数量是第一数量或第二数量之一,其中,所述第一数量大于所述第二数量;确定第一块具有第二数量的经量化变换系数;将所述第一块转换成具有第一数量的经量化变换系数的经转换块;调节主神经网络,所述主神经网络被训练成在给定至少一个调节变量的情况下预测至少一个输出变量,所述至少一个调节变量基于关于所述经转换块的信息和所述第一块的块长度信息;从所述主神经网络的输出级提供至少一个预测的变换系数。

    一般媒体神经网络预测器和包括这种预测器的生成模型

    公开(公告)号:CN116324982A

    公开(公告)日:2023-06-23

    申请号:CN202180069786.0

    申请日:2021-10-12

    Abstract: 一种用于预测媒体信号的频率系数的神经网络系统,所述神经网络系统包括:时间预测部分,所述时间预测部分包括至少一个神经网络,所述至少一个神经网络被训练成在给定一个或若干个先前时间帧的系数的情况下,预测表示当前时间帧的特定频带的第一输出变量集合;以及频率预测部分,所述频率预测部分包括至少一个神经网络,所述至少一个神经网络被训练成在给定与所述当前时间帧中的特定频带毗邻的一个或若干个频带的系数的情况下,预测表示所述特定频带的第二输出变量集合。这种神经网络系统形成了能够捕获媒体信号的时频片中出现的时间依赖性和频率依赖性两者的预测器。

    响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频

    公开(公告)号:CN107770718B

    公开(公告)日:2020-01-17

    申请号:CN201711094044.5

    申请日:2014-12-18

    Abstract: 本公开涉及响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频。在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。

    响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频

    公开(公告)号:CN105874820A

    公开(公告)日:2016-08-17

    申请号:CN201480071993.X

    申请日:2014-12-18

    Abstract: 在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。

    用于通过预白化确定通过LMS算法调整的自适应滤波器的更新滤波系数的方法

    公开(公告)号:CN102132491B

    公开(公告)日:2014-07-16

    申请号:CN200980133068.4

    申请日:2009-08-24

    CPC classification number: H03H21/0012 G10L19/012 H04B3/235

    Abstract: 本发明涉及一种用于确定通过LMS算法调整的自适应滤波器(22)的至少一个更新的滤波器系数的方法。根据所述方法,确定第一白化滤波器(25′)的滤波器系数、尤其是LPC白化滤波器的滤波器系数。第一白化滤波器(25′)生成经滤波的信号。基于在确定第一白化滤波器(25′)的滤波器系数期间获得的一个或多个计算值确定归一化值。归一化值关联于该经滤波的信号的能量。依赖于该经滤波的信号和归一化值确定自适应滤波器(22)的至少一个更新的滤波器系数。优选地,确定对于自适应滤波器(22)的所有滤波器系数的更新的滤波器系数。

Patent Agency Ranking