多通道音频数据编码/解码方法和设备

    公开(公告)号:CN101789792A

    公开(公告)日:2010-07-28

    申请号:CN201010122240.0

    申请日:2005-07-14

    CPC classification number: H04S3/008 G10L19/008

    Abstract: 提供一种多通道音频数据编码和/或解码方法以及设备。该编码方法包括:编码单声道和/或立体声音频数据;以及编码除了单声道和/或立体声音频数据之外的扩展的多通道音频数据。解码方法包括:解码单声道和/或立体声音频数据;检验除了单声道和/或立体声音频数据之外是否存在将被解码的扩展的多通道音频数据;如果存在,则解码该数据。根据该方法和设备,仅通过一个比特流,可根据用户环境来提供单声道、立体声和多通道。另外在多通道音频中,根据用户终端和网络的状态提供精细可分级(FGS)功能。此外,可实现BSAC的性能的增强。可满足对MPEG标准化的各种需求。可用于更逼真的数字多媒体广播和基于移动以及基于家庭影院的服务。

    可伸缩地编解码音频数据的方法和装置

    公开(公告)号:CN100555413C

    公开(公告)日:2009-10-28

    申请号:CN03165037.6

    申请日:2003-09-17

    Abstract: 对音频数据进行可伸缩编码/解码的方法和装置。对音频数据进行可伸缩编码的方法包括,对包含与第一层对应的定标因子信息和编码模型信息的附加信息进行编码,通过参考编码模型信息,以K比特为单位按照从MSB到LSB和从低频到高频的顺序对与第一层对应的多个量化样本进行算术编码,其中K是大于或等于1的一个整数,并且通过每次使层的序数加1,重复进行这些步骤,直到多层的编码被完成。按照这个方法,精细粒度可伸缩性(FGS)可以具有低的复杂性,即使在低层也可以获得较好的音频质量。

    用于编码/解码具有辅助信息的音频比特流的方法和设备

    公开(公告)号:CN100525457C

    公开(公告)日:2009-08-05

    申请号:CN200410103796.X

    申请日:2004-11-26

    CPC classification number: G10H1/0058 G10L19/24

    Abstract: 提供了一种用于编码/解码具有辅助信息的MPEG-4位片算术编码(BSAC)音频比特流的方法和设备。所述编码方法包括:把时域音频信号转换为频域音频信号,并量化所述音频信号;对数据比特数进行计数;获得每一层可用的比特数;考虑到辅助信息的大小而修正每一层可用的比特数;以层为单位编码实际音频数据;并在编码比特流中嵌入辅助信息。所述解码方法包括:解码报头;计算音频比特流的层结构;将一直到顶层的数据的大小与帧的大小之间的差值确定为辅助信息的大小;根据所述辅助信息的大小,而提取所述辅助信息;并解码所述音频比特流。当通过持有辅助信息而提供使用BSAC的服务时,能改善音频内容的元数据和音质。

    量化和反量化输入信号的方法和设备以及对输入信号编码和解码的方法和设备

    公开(公告)号:CN101406064A

    公开(公告)日:2009-04-08

    申请号:CN200680054016.4

    申请日:2006-10-19

    Abstract: 一种用于对输入信号进行量化和反量化的方法和设备,以及一种用于对输入信号进行编码和解码的方法和设备。对输入信号进行量化的方法包括:根据输入信号的分布特征确定量化位阶类型,以及根据确定的量化位阶类型对输入信号进行量化。因此,当在编码处理中分配比特的数量少时,可在不增加复杂度或必须使用大量的附加信息以便确定最优位阶的情况下最小化信号失真。另外,可通过考虑失真率相应于输入信号的分配比特的数量的权衡来对输入信号进行编码和解码。

    对多声道音频信号进行编码/解码的系统、介质和方法

    公开(公告)号:CN101326726A

    公开(公告)日:2008-12-17

    申请号:CN200680043416.5

    申请日:2006-11-21

    Abstract: 一种对多声道音频信号进行编码/解码的系统、介质和方法,所述系统包括:解码级别产生单元,产生用于将包括一定数量的音频声道信号和空间信息的比特流解码为一定数量的音频声道信号的解码级别信息,其中,所述空间信息包括关于相应的声道之间的幅值差和/或相似性的信息;音频解码器,根据解码级别信息对比特流进行解码。因此,即使单个输入流也可基于使用的扬声器配置的类型被选择性地解码为合适数量的声道。可通过对输入的比特流进行部分地解码来实现可伸缩声道解码。在可伸缩声道解码中,解码器可设置解码级别,并根据解码级别输出音频声道信号,从而可降低解码复杂性。

    提供可分级BSAC音频数据的算术解码的方法和装置

    公开(公告)号:CN101278485A

    公开(公告)日:2008-10-01

    申请号:CN200680036932.5

    申请日:2006-10-02

    CPC classification number: H03M7/30 G10L19/24

    Abstract: 提供一种可分级比特分片算术编码(BSAC)音频数据的算术解码的方法和装置。所述算术解码方法包括:检查是否BSAC音频数据的最终层的所有边信息都被解码;以及当最终层的所有边信息没有都被解码时,执行BSAC智能解码以及终止解码,当最终层的所有边信息都被解码时,终止最终层的解码。所述BSAC智能解码包括:检查是否能够不考虑在截去的比特流之后读取的数据而确定将被解码的符号;当能够不考虑在截去的比特流之后读取的数据而执行解码时,继续进行解码;以及当确定将被的解码的符号依赖于在截去的比特流之后读取的数据时,确定出现模糊且终止解码。因此,在MPEG-4 BSAC解码器中设置字节级可分级性。即使比特流被截去,也能知道解码终止时间,也能执行对于比特流的截去的部分的附加解码。

Patent Agency Ranking