-
公开(公告)号:CN119856498A
公开(公告)日:2025-04-18
申请号:CN202380065259.1
申请日:2023-09-12
Applicant: 杜比实验室特许公司
IPC: H04N21/233 , H04N5/14 , H04N21/234 , H04N21/439 , H04N21/44
Abstract: 公开了一种用于生成用于在捕获时对象渲染的自动视听分析的系统和方法。一个示例提供了一种处理视听内容的方法。该方法包括:接收包括多个音频帧和多个视频帧的内容;将多个音频帧中的每一个音频帧分类为多个音频分类;以及将多个视频帧中的每一个视频帧分类为多个视频分类。该方法包括:基于相应音频分类来处理多个音频帧;以及基于相应视频分类来处理多个视频帧。每个音频分类用不同的音频处理操作来处理,并且每个视频分类用不同的视频处理操作来处理。该方法包括通过合并经处理的多个音频帧和经处理的多个视频帧来生成该内容的音频/视频表示。
-
公开(公告)号:CN112530450B
公开(公告)日:2025-04-11
申请号:CN202010971886.X
申请日:2020-09-16
Applicant: 杜比实验室特许公司
IPC: G10L21/0208 , G10L21/0216 , G10L21/0224 , G10L21/0232
Abstract: 用于频域中的样本精度延迟识别的系统、方法和计算机程序产品。在一些实施例中,估计在指示第一音频信号的样本的第一数据块和指示第二音频信号的样本的第二数据块上执行,并且包含确定粗略时延估计值,包含通过确定当应用于所述第二块中的一些时确定所述第一块中的一个的估计值的增益,并识别所述估计值中与所述第一块中的所述一个具有最佳频谱匹配的一个。根据所述粗略估计值和所述增益中的一些确定经优化时延估计值。任选地,生成指示对所述经优化时延估计值的置信度的至少一个度量。可对所述频域数据执行音频处理(例如,回波消除),包含通过基于所述经优化时延估计值执行时间对齐。
-
公开(公告)号:CN111819627B
公开(公告)日:2025-04-11
申请号:CN201980017282.7
申请日:2019-07-02
IPC: G10L19/008 , G10L19/16 , G10L19/18 , H04S3/00
Abstract: 本文件描述一种用于对多声道输入信号(201)进行编码的方法(700)。所述方法(700)包括从所述多声道输入信号(201)确定(701)多个降混声道信号(203)及对所述多个降混声道信号(203)实行(702)能量压缩以提供多个经压缩声道信号(404)。此外,所述方法(700)包括基于所述多个经压缩声道信号(404)且基于所述多声道输入信号(201)确定(703)联合译码元数据(205),其中所述联合译码元数据(205)使得其允许将所述多个经压缩声道信号(404)升混成所述多声道输入信号(201)的近似值。另外,所述方法(700)包括对所述多个经压缩声道信号(404)及所述联合译码元数据(205)进行编码(704)。
-
公开(公告)号:CN119790458A
公开(公告)日:2025-04-08
申请号:CN202380060928.6
申请日:2023-08-18
Applicant: 杜比实验室特许公司
IPC: G10L21/028 , G10L19/008 , G06N3/045 , G06N3/08
Abstract: 公开了一种用于分离混合音频信号中的音频对象的方法,所述混合音频信号包括多个音频对象。进一步公开了一种用于训练稀疏音频对象分离模型的计算机实施的方法以及一种用于从混合音频信号中分离稀疏音频对象的方法,所述混合音频信号至少包括稀疏音频对象、非稀疏音频对象以及至少一个另外的音频对象。进一步公开了一种用于基于信噪比SNR来处理音频的计算机实施的方法以及一种用于基于场景环境分类来处理音频的计算机实施的方法。公开了一种非暂态计算机可读介质以及一种被配置为执行所述方法中的一种或多种的系统。
-
公开(公告)号:CN115002455B
公开(公告)日:2025-03-25
申请号:CN202210683067.4
申请日:2016-06-07
Applicant: 杜比实验室特许公司
IPC: H04N19/105 , H04N19/109 , H04N19/139 , H04N19/159 , H04N19/174 , H04N19/176 , H04N19/51 , H04N19/52 , H04N19/523 , H04N19/593 , H04N19/70 , H04N19/82
Abstract: 本发明公开了一种图像编码和解码方法以及图像解码设备,用于从包括当前画面的参考画面的参考块中选择预测候选,并且在图像编码和解码期间使用所选择预测候选来导出当前块的运动信息。图像编码和解码方法包括以下步骤:配置空间运动向量候选;确定当前画面内是否存在当前块的参考画面;当当前画面内存在当前块的参考画面时,添加在当前块之前编码的当前画面的另一块中的空间运动向量候选。
-
公开(公告)号:CN119676512A
公开(公告)日:2025-03-21
申请号:CN202411818698.8
申请日:2020-01-09
Applicant: 杜比实验室特许公司
IPC: H04N21/44 , G09G3/20 , G09G3/00 , H04N21/84 , H04N21/4402 , H04N21/422
Abstract: 本公开涉及具有环境光补偿的显示器管理。描述一种显示设备、显示器管理模块及用于环境光补偿的方法。所述显示器管理模块经配置以接收包括视频帧的序列的输入视频信号,并确定所述视频帧的序列的当前视频帧是否紧跟场景改变。所述显示器管理模块经进一步配置以仅响应于确定所述视频帧的序列的所述当前视频帧紧跟场景改变而依赖于指示环境光的强度的信号来调整应用到所述输入信号的环境光补偿。
-
公开(公告)号:CN119649826A
公开(公告)日:2025-03-18
申请号:CN202510020462.8
申请日:2019-04-15
IPC: G10L19/008 , H04S7/00
Abstract: 本公开涉及用于定向声源的编码及解码的方法、设备及系统。一些编码方法可涉及接收对应于音频对象的单声道信号及对应于所述音频对象的辐射模式的表示。所述辐射模式可包含对应于多个采样时间、多个频带及多个方向的声级。所述方法可涉及对所述单声道音频信号进行编码以及对所述源辐射模式进行编码以确定辐射模式元数据。对所述辐射模式进行编码可涉及确定辐射模式的所述表示的球面调和变换并压缩所述球面调和变换以获得经编码辐射模式元数据。
-
公开(公告)号:CN119605163A
公开(公告)日:2025-03-11
申请号:CN202380055699.9
申请日:2023-07-20
Applicant: 杜比实验室特许公司
Inventor: G·J·沃德
Abstract: 提供了用于基于与示例的相似度来对图像和视频进行颜色分级的系统和方法。在准备对新内容进行颜色分级时,可以获得与预期的新内容相关的示例帧,并且可以获得示例帧的颜色分级参数。为了在新内容被创建或接收时对新内容进行颜色分级,可以确定新内容的帧与示例帧之间的相似度。可以确定新内容的帧与示例帧之间的相似度,可以将相似度与所获得的来自示例帧的颜色分级参数进行组合,以确定应用于新内容的合适的颜色分级参数。然后可以使用所确定的颜色分级参数对新内容进行颜色分级。
-
公开(公告)号:CN116744010B
公开(公告)日:2025-03-07
申请号:CN202310732973.3
申请日:2017-10-03
Applicant: 杜比实验室特许公司
IPC: H04N19/186 , H04N19/70 , H04N19/46 , H04N21/235 , H04N21/84
Abstract: 描述了与源颜色体积信息的处理相关的计算机可读存储介质。这种数据至少包括源数据中的最小亮度值、最大亮度值和平均亮度值加上可选数据,所述可选数据可以包括:所述源数据的输入原色(例如,红色、绿色和蓝色)的颜色体积x色度坐标和y色度坐标、以及与所述源数据中的所述最小亮度值、所述平均亮度值和所述最大亮度值相对应的所述原色的颜色x色度坐标和y色度坐标。还可以包括用信号表示每个图片中的有效区域的消息传送数据。
-
公开(公告)号:CN119479682A
公开(公告)日:2025-02-18
申请号:CN202310944857.8
申请日:2014-01-15
IPC: G10L21/034 , G10L21/0364 , G10L19/02 , G10L19/16 , G10L25/60 , H04R29/00 , H03G9/00 , G06F3/16
Abstract: 本公开涉及用于在不同回放设备之间优化响度和动态范围的系统和方法。实施例涉及如下的方法和系统,其用于在位流中接收与音频数据相关联的元数据,并且分析该元数据以确定在位流中是否可获得用于第一组音频回放设备的响度参数。响应于确定存在用于第一组的参数,系统使用该参数和音频数据来呈现音频。响应于确定不存在用于第一组的响度参数,系统分析第一组的一个或多个特性并且基于该一个或多个特性来确定参数。
-
-
-
-
-
-
-
-
-