用于在捕获时进行对象渲染的视听分析

    公开(公告)号:CN119856498A

    公开(公告)日:2025-04-18

    申请号:CN202380065259.1

    申请日:2023-09-12

    Abstract: 公开了一种用于生成用于在捕获时对象渲染的自动视听分析的系统和方法。一个示例提供了一种处理视听内容的方法。该方法包括:接收包括多个音频帧和多个视频帧的内容;将多个音频帧中的每一个音频帧分类为多个音频分类;以及将多个视频帧中的每一个视频帧分类为多个视频分类。该方法包括:基于相应音频分类来处理多个音频帧;以及基于相应视频分类来处理多个视频帧。每个音频分类用不同的音频处理操作来处理,并且每个视频分类用不同的视频处理操作来处理。该方法包括通过合并经处理的多个音频帧和经处理的多个视频帧来生成该内容的音频/视频表示。

    频域中的样本精度延迟识别

    公开(公告)号:CN112530450B

    公开(公告)日:2025-04-11

    申请号:CN202010971886.X

    申请日:2020-09-16

    Abstract: 用于频域中的样本精度延迟识别的系统、方法和计算机程序产品。在一些实施例中,估计在指示第一音频信号的样本的第一数据块和指示第二音频信号的样本的第二数据块上执行,并且包含确定粗略时延估计值,包含通过确定当应用于所述第二块中的一些时确定所述第一块中的一个的估计值的增益,并识别所述估计值中与所述第一块中的所述一个具有最佳频谱匹配的一个。根据所述粗略估计值和所述增益中的一些确定经优化时延估计值。任选地,生成指示对所述经优化时延估计值的置信度的至少一个度量。可对所述频域数据执行音频处理(例如,回波消除),包含通过基于所述经优化时延估计值执行时间对齐。

    音频对象分离和处理音频
    4.
    发明公开

    公开(公告)号:CN119790458A

    公开(公告)日:2025-04-08

    申请号:CN202380060928.6

    申请日:2023-08-18

    Abstract: 公开了一种用于分离混合音频信号中的音频对象的方法,所述混合音频信号包括多个音频对象。进一步公开了一种用于训练稀疏音频对象分离模型的计算机实施的方法以及一种用于从混合音频信号中分离稀疏音频对象的方法,所述混合音频信号至少包括稀疏音频对象、非稀疏音频对象以及至少一个另外的音频对象。进一步公开了一种用于基于信噪比SNR来处理音频的计算机实施的方法以及一种用于基于场景环境分类来处理音频的计算机实施的方法。公开了一种非暂态计算机可读介质以及一种被配置为执行所述方法中的一种或多种的系统。

    用于定向声源的编码及解码的方法、设备及系统

    公开(公告)号:CN119649826A

    公开(公告)日:2025-03-18

    申请号:CN202510020462.8

    申请日:2019-04-15

    Abstract: 本公开涉及用于定向声源的编码及解码的方法、设备及系统。一些编码方法可涉及接收对应于音频对象的单声道信号及对应于所述音频对象的辐射模式的表示。所述辐射模式可包含对应于多个采样时间、多个频带及多个方向的声级。所述方法可涉及对所述单声道音频信号进行编码以及对所述源辐射模式进行编码以确定辐射模式元数据。对所述辐射模式进行编码可涉及确定辐射模式的所述表示的球面调和变换并压缩所述球面调和变换以获得经编码辐射模式元数据。

    基于与示例的相似度的颜色分级内容

    公开(公告)号:CN119605163A

    公开(公告)日:2025-03-11

    申请号:CN202380055699.9

    申请日:2023-07-20

    Inventor: G·J·沃德

    Abstract: 提供了用于基于与示例的相似度来对图像和视频进行颜色分级的系统和方法。在准备对新内容进行颜色分级时,可以获得与预期的新内容相关的示例帧,并且可以获得示例帧的颜色分级参数。为了在新内容被创建或接收时对新内容进行颜色分级,可以确定新内容的帧与示例帧之间的相似度。可以确定新内容的帧与示例帧之间的相似度,可以将相似度与所获得的来自示例帧的颜色分级参数进行组合,以确定应用于新内容的合适的颜色分级参数。然后可以使用所确定的颜色分级参数对新内容进行颜色分级。

Patent Agency Ranking