-
公开(公告)号:CN115410583A
公开(公告)日:2022-11-29
申请号:CN202210834906.8
申请日:2019-04-10
Applicant: 杜比实验室特许公司
Abstract: 本公开涉及基于机器学习的用于音频编码和解码的基于感知的损失函数。提供了用于训练神经网络以及用于通过训练的神经网络来实现音频编码器和解码器的计算机实现的方法。神经网络可以接收输入音频信号,生成编码音频信号并且对编码音频信号进行解码。损失函数生成模块可以接收解码音频信号和真值音频信号,并且可以生成与解码音频信号相对应的损失函数值。生成损失函数值可涉及应用心理声学模型。可以基于损失函数值来训练神经网络。训练可涉及更新神经网络的至少一个权重。
-
公开(公告)号:CN105900168A
公开(公告)日:2016-08-24
申请号:CN201480008591.5
申请日:2014-01-22
Applicant: 杜比实验室特许公司
IPC: G10L19/008 , G10L19/02
Abstract: 所接收的音频数据可包括第一组频率系数和第二组频率系数。可至少部分地基于所述第一组频率系数的至少一部分来估计用于所述第二组频率系数的至少一部分的空间参数。所估计的空间参数可应用于所述第二组频率系数以生成经修正的第二组频率系数。所述第一组频率系数可对应于第一频率范围(例如,单独通道频率范围),而所述第二组频率系数可对应于第二频率范围(例如,耦合通道频率范围)。复合耦合通道的组合频率系数可基于两个或更多个通道的频率系数。第一通道的频率系数与组合频率系数之间的互相关系数可被计算。
-
公开(公告)号:CN105324812A
公开(公告)日:2016-02-10
申请号:CN201480034435.6
申请日:2014-06-17
Applicant: 杜比实验室特许公司
IPC: G10L19/038
CPC classification number: G10L19/038 , G10L19/008 , H04N19/94
Abstract: 第一矢量量化处理可被应用于N维参数集合的沿第一维度的两个或更多个参数值以产生第一组量化值。可至少部分地基于第一组量化值中的一个或多个值对于该N维参数集合的第二维度计算两个或更多个参数预测值。可至少部分地基于参数预测值计算预测残差值。第二矢量量化处理可被应用于该预测残差值以产生第二组量化值。这些处理可被扩展到任何数量的维度。对应的逆矢量量化处理可被执行。
-
公开(公告)号:CN104768121A
公开(公告)日:2015-07-08
申请号:CN201410178258.0
申请日:2014-04-29
Applicant: 杜比实验室特许公司
IPC: H04S5/00
CPC classification number: H04S7/306 , G10L19/008 , H04S3/004 , H04S7/307 , H04S2400/03 , H04S2400/13 , H04S2420/01
Abstract: 本公开涉及响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频。在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向该组的通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。
-
公开(公告)号:CN118433628A
公开(公告)日:2024-08-02
申请号:CN202410510302.7
申请日:2014-12-18
Applicant: 杜比实验室特许公司
IPC: H04S7/00 , G10L19/008 , H04S3/00
Abstract: 本公开涉及响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频。在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。
-
公开(公告)号:CN116368497A
公开(公告)日:2023-06-30
申请号:CN202180070787.7
申请日:2021-10-15
Applicant: 杜比实验室特许公司
IPC: G06N3/0464
Abstract: 本发明涉及一种用于通过以下操作预测表示自适应块长度媒体信号的频率内容的变换系数的方法:接收帧并接收指示所述帧中每个块的经量化变换系数的数量的块长度信息,所述经量化变换系数的数量是第一数量或第二数量之一,其中,所述第一数量大于所述第二数量;确定第一块具有第二数量的经量化变换系数;将所述第一块转换成具有第一数量的经量化变换系数的经转换块;调节主神经网络,所述主神经网络被训练成在给定至少一个调节变量的情况下预测至少一个输出变量,所述至少一个调节变量基于关于所述经转换块的信息和所述第一块的块长度信息;从所述主神经网络的输出级提供至少一个预测的变换系数。
-
公开(公告)号:CN116324982A
公开(公告)日:2023-06-23
申请号:CN202180069786.0
申请日:2021-10-12
IPC: G10L21/038
Abstract: 一种用于预测媒体信号的频率系数的神经网络系统,所述神经网络系统包括:时间预测部分,所述时间预测部分包括至少一个神经网络,所述至少一个神经网络被训练成在给定一个或若干个先前时间帧的系数的情况下,预测表示当前时间帧的特定频带的第一输出变量集合;以及频率预测部分,所述频率预测部分包括至少一个神经网络,所述至少一个神经网络被训练成在给定与所述当前时间帧中的特定频带毗邻的一个或若干个频带的系数的情况下,预测表示所述特定频带的第二输出变量集合。这种神经网络系统形成了能够捕获媒体信号的时频片中出现的时间依赖性和频率依赖性两者的预测器。
-
公开(公告)号:CN107770718B
公开(公告)日:2020-01-17
申请号:CN201711094044.5
申请日:2014-12-18
Applicant: 杜比实验室特许公司
IPC: H04S7/00 , G10L19/008 , H04S3/00
Abstract: 本公开涉及响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频。在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。
-
公开(公告)号:CN105874820A
公开(公告)日:2016-08-17
申请号:CN201480071993.X
申请日:2014-12-18
Applicant: 杜比实验室特许公司
IPC: H04S3/00
Abstract: 在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。
-
公开(公告)号:CN102132491B
公开(公告)日:2014-07-16
申请号:CN200980133068.4
申请日:2009-08-24
Applicant: 杜比实验室特许公司
IPC: H03H21/00
CPC classification number: H03H21/0012 , G10L19/012 , H04B3/235
Abstract: 本发明涉及一种用于确定通过LMS算法调整的自适应滤波器(22)的至少一个更新的滤波器系数的方法。根据所述方法,确定第一白化滤波器(25′)的滤波器系数、尤其是LPC白化滤波器的滤波器系数。第一白化滤波器(25′)生成经滤波的信号。基于在确定第一白化滤波器(25′)的滤波器系数期间获得的一个或多个计算值确定归一化值。归一化值关联于该经滤波的信号的能量。依赖于该经滤波的信号和归一化值确定自适应滤波器(22)的至少一个更新的滤波器系数。优选地,确定对于自适应滤波器(22)的所有滤波器系数的更新的滤波器系数。
-
-
-
-
-
-
-
-
-