Abstract:
An audio/speech encoding method transforms a time domain input signal to a frequency spectrum; divides the spectrum to plurality of bands; calculates and quantizes a level of energies for each band; calculates differential indices between an Nth band index and an (N-1)th band index, N being an integer of 1 or more, modifies a range of the differential indices for the Nth band when N is an integer of 2 or more, and replaces the differential index with the modified differential index; encodes the differential indices using a Huffman table selected based on minimum and maximum values of the differential indices; and transmits the encoded differential indices and a flag signal for indicating the selected Huffman table.
Abstract:
In this invention, the design of the Huffman table can be done offline with a large input sequence database. The range of the quantization indices (or differential indices) for Huffman coding is identified. For each value of range, all the input signal which have the same range will be gathered and the probability distribution of each value of the quantization indices (or differential indices) within the range is calculated. For each value of range, one Huffman table is designed according to the probability. And in order to improve the bits efficiency of the Huffman coding, apparatus and methods to reduce the range of the quantization indices (or differential indices) are also introduced.
Abstract:
In this invention, the design of the Huffman table can be done offline with a large input sequence database. The range of the quantization indices (or differential indices) for Huffman coding is identified. For each value of range, all the input signal which have the same range will be gathered and the probability distribution of each value of the quantization indices (or differential indices) within the range is calculated. For each value of range, one Huffman table is designed according to the probability. And in order to improve the bits efficiency of the Huffman coding, apparatus and methods to reduce the range of the quantization indices (or differential indices) are also introduced.
Abstract:
Un aparato de codificación de audio/voz, que comprende: un procesador; una memoria; un transformador adaptado para transformar una señal de audio/voz de entrada al dominio de tiempos en un espectro de frecuencias; un divisor de banda adaptado para dividir el espectro de frecuencias en una pluralidad de bandas; un calculador del factor de norma adaptado para calcular un nivel de factores de norma para cada banda; un cuantificador adaptado para cuantificar los factores de norma para cada banda; un calculador del índice diferencial (1301) adaptado para calcular los índices diferenciales entre un índice de banda N-ésima y un índice de banda (N-1)-ésima, en donde N es un entero de 1 o más; un modificador del índice diferencial (1302) adaptado para modificar un intervalo de los índices diferenciales para la N-ésima banda cuando N es un entero de 2 o más, y sustituir el índice diferencial con el índice diferencial modificado y adaptado para no modificar el intervalo de los índices diferenciales para la banda N-ésima cuando N es un entero de 1; un codificador (1304; 1305) de Huffman adaptado para codificar los índices diferenciales usando una tabla de Huffman seleccionada entre un número de tablas de Huffman predefinidas; y un transmisor adaptado para transmitir los índices diferenciales codificados y una señal de bandera para indicar la tabla de Huffman seleccionada a un aparato de decodificación de audio/voz, en donde cuando el índice diferencial calculado de la banda (N-1)-ésima es mayor que un primer valor, el modificador del índice diferencial es adaptado para modificar un índice diferencial para una banda N-ésima añadiendo un valor sustraído determinado sustrayendo el primer valor de un índice diferencial para una banda (N- 1)-ésima, en donde cuando el índice diferencial calculado de una banda (N-1)-ésima es menor que un segundo valor, el modificador del índice diferencial está adaptado para modificar un índice diferencial para una banda N-ésima añadiendo un valor sustraído determinado sustrayendo el segundo valor de un índice diferencial para la banda (N- 1)-ésima, en donde el primer valor es una suma de un valor desplazado y un valor umbral, y el segundo valor es una diferencia del valor desplazado y el valor umbral, y el valor desplazado es 15, y en donde cuando el índice diferencial calculado de la banda (N-1)-ésima no es mayor que el primer valor y no es menor que el segundo valor, el modificador del índice diferencial es adaptado para no modificar un índice diferencial para la banda N-ésima.
Abstract:
Se proporciona un dispositivo de codificación de voz-sonido, un dispositivo de decodificación de voz-sonido, un método de codificación de voz-sonido y un método de decodificación de voz-sonido que realiza eficientemente la distribución de bits y mejora la calidad del sonido. La unidad de identificación de bandas de frecuencia dominantes (301) identifica una banda de frecuencia dominante que tiene un valor de factor de norma que es el valor máximo dentro del espectro de una señal de voz-sonido de entrada. Las unidades de determinación de grupos dominantes (302-1 a 302-N) y una unidad de determinación de grupos no dominantes (303) agrupan todas las sub-bandas en un grupo dominante que contiene la banda de frecuencia dominante y un grupo no dominante que no contiene una banda de frecuencia dominante. Una unidad de distribución de bits de grupos (308) distribuye bits a cada grupo en la base de la energía y la distribución de norma de cada grupo. Una unidad de distribución de bits de sub-bandas (309) redistribuye los bits que han sido distribuidos a cada grupo a cada sub-banda de acuerdo con la relación de la norma con respecto a la energía de los grupos.
Abstract:
An audio encoding apparatus capable of reducing the bit rate even if a codebook having a larger codebook number is selected in a split multi-rate lattice vector quantization is provided. Sub-vector determining unit (121) determines, in the spectrum of an input signal having been divided into a predetermined number of sub-vectors, a sub-vector using the largest number of bits. Positional information encoding unit (122) encodes the positional information of the determined sub-vector. Codebook indication value estimating unit (124) estimates a number of used bits for a codebook indication value of the largest number of used bits by use of the (N - 1) other codebook indication values, and generates a number-of-used-bits estimation value. Difference calculating unit (125) calculates a difference by subtracting the number-of-used-bits estimation value from the actual value of the codebook indication value of the largest number of used bits. Difference encoding unit (126) encodes the difference information.