Abstract:
A method of processing an audio signal includes determining an average signal-to-noise ratio for the audio signal over time. The method includes, based on the determined average signal-to-noise ratio, a formant-sharpening factor is determined. The method also includes applying a filter that is based on the determined formant-sharpening factor to a codebook vector that is based on information from the audio signal.
Abstract:
A method includes filtering, at a speech encoder, an audio signal into a first group of sub-bands within a first frequency range and a second group of sub-bands within a second frequency range. The method also includes generating a harmonically extended signal based on the first group of sub-bands. The method further includes generating a third group of sub-bands based, at least in part, on the harmonically extended signal. The third group of sub-bands corresponds to the second group of sub-bands. The method also includes determining a first adjustment parameter for a first sub-band in the third group of sub-bands or a second adjustment parameter for a second sub-band in the third group of sub-bands. The first adjustment parameter is based on a metric of a first sub-band in the second group of sub-bands, and the second adjustment parameter is based on a metric of a second sub-band in the second group of sub-bands.
Abstract:
A method includes receiving a second audio frame at a decoder. The second audio frame follows a first audio frame in an audio signal and includes a first number of bits allocated to primary coding information associated with the second audio frame, a second number of bits allocated to redundant coding information associated with the first audio frame, and an indicator of a frame type of the first audio frame. In response to a frame erasure condition associated with the first audio frame, the second number of bits is determined based on the indicator and used to decode the first audio frame. In clean channel conditions, the first audio frame is received and decoded based on primary coding bits in the first audio frame, and the first number of bits is determined based on the indicator and used to decode the second audio frame.
Abstract:
Un procedimiento de funcionamiento de un dispositivo, comprendiendo el procedimiento: recibir (510) un primer conjunto de muestras y un segundo conjunto de muestras, en el que el primer conjunto de muestras corresponde a una parte de una primera trama de audio y el segundo conjunto de muestras corresponde a una segunda trama de audio; generar (520) un primer parámetro de energía asociado con un conjunto de muestras objetivo en ventana basado en el primer conjunto de muestras y un primer subconjunto del segundo conjunto de muestras; generar (530) un segundo parámetro de energía asociado con un conjunto de muestras de referencia en ventana que incluye un segundo subconjunto del segundo conjunto de muestras; realizar una operación de raíz cuadrada en una relación del segundo parámetro de energía y el primer parámetro de energía para generar un factor de escala; escalar (540) el conjunto de muestras objetivo basado en el factor de escala, para generar un conjunto objetivo escalado de muestras; y generar (550) un tercer conjunto de muestras basado en el conjunto de muestras objetivo escalado y una o más muestras del segundo conjunto de muestras.
Abstract:
Un procedimiento, que comprende: recibir, en un vocodificador, una señal de audio (102) muestreada a una primera frecuencia de muestreo, donde la señal de audio comprende una primera subparte de señal de banda alta (124) y una segunda subparte de señal de banda alta (125); generar, en un codificador de banda baja del vocodificador, una señal de excitación de banda baja (144) en función de una parte de banda baja de la señal de audio; generar, en un codificador de banda alta del vocodificador, una primera señal de banda base (162) para modelar dicha primera subparte de señal de banda alta, en el que generar la primera señal de banda base incluye realizar una operación de volteo espectral en una versión transformada de forma no lineal de la señal de excitación de banda baja; y generar, en dicho codificador de banda alta, una segunda señal de banda base (164) para modelar dicha segunda subparte de señal de banda alta, en el que la primera subparte es distinta de la segunda subparte, caracterizado por que la segunda señal de banda base está basada en la primera señal de banda base (162).
Abstract:
Un procedimiento (600) para gestionar el audio durante una conferencia, con el procedimiento (600) que comprende: recibir (602), en una primera memoria intermedia (210) de un dispositivo móvil (102), una primera transmisión de audio (114) de un primer dispositivo (110) asociado con un primer participante de la conferencia; recibir (604), en una segunda memoria intermedia (220) del dispositivo móvil (102), una segunda transmisión de audio (124) de un segundo dispositivo (120) asociado con un segundo participante de la conferencia; caracterizado por generar (606) una señal de control (204) en un controlador de retardo (202) del dispositivo móvil (102), con la señal de control (204) proporcionada a la primera memoria intermedia (210) y a la segunda memoria intermedia (220) para sincronizar el primer audio de memoria intermedia (214) que se envía desde la primera memoria intermedia (210) con el segundo audio de memoria intermedia (224) que se envía desde la segunda memoria intermedia (220).
Abstract:
A method of operation of a device includes receiving a first set of samples and a second set of samples. The first set of samples corresponds to a portion of a first audio frame and the second set of samples corresponds to a second audio frame. The method further includes generating a target set of samples based on the first set of samples and a first subset of the second set of samples and generating a reference set of samples based at least partially on a second subset of the second set of samples. The method also includes scaling the target set of samples to generate a scaled target set of samples and generating a third set of samples based on the scaled target set of samples and one or more samples of the second set of samples.