Abstract:
본 발명은 공간큐 기반의 바이노럴 스테레오 합성 장치 및 그 방법과, 그를 이용한 바이노럴 스테레오 복호화 장치에 관한 것으로, 공간큐 정보(가상음원 위치정보)와 각 채널별 바이노럴 필터 계수에 기초하여 좌/우 오디오 신호를 주파수 영역에서 필터링하고, 그 필터링된 신호를 바이노럴 스테레오 신호로 복호화함으로써, 주파수 영역에서의 선형 복적분을 통해 고품질의 바이노럴 스테레오 신호를 용이하게 재생할 수 있게 하는, 공간큐 기반의 바이노럴 스테레오 합성 장치 및 그 방법과, 그를 이용한 바이노럴 스테레오 복호화 장치를 제공하고자 한다. 이를 위하여, 본 발명은, 공간큐 기반의 바이노럴 스테레오 합성 장치에 있어서, 가상음원 위치 기반의 공간큐 정보를 합성하여 서브밴드별 각 채널의 파워 이득값을 산출하기 위한 공간큐 정보 합성 수단; 상기 산출된 각 채널의 파워 이득값과 바이노럴 필터 계수에 기초하여, 좌/우 오디오 신호를 주파수 영역에서 필터링하기 위한 신호 필터링 수단; 및 상기 필터링된 신호를 시간 영역으로 역변환하기 위한 신호 역변환 수단을 포함한다. 공간큐 정보, 가상음원 위치정보, 바이노럴 필터 계수, 바이노럴 스테레오 합성, 바이노럴 스테레오 복호화, 공간큐 기반의 오디오 코딩, 3차원 오디오
Abstract:
PURPOSE: A unified speech/audio coder(USAC) processing windows sequence based mode switching is provided to perform encoding or decoding by processing different window sequences for different situation, thereby improving coding efficiency. CONSTITUTION: A mode switching unit performs inter-linear prediction domain mode switching for the sub-frames which constitute a frame of an input signal. An encoding unit applies a window sequence to current encoding subframes, wherein the window sequence is based on a switched LPD(Linear Prediction Domain) mode. In addition, the encoding unit applies a changed window sequence to the current encoding subframe according to the LPD modes of previous and following subframes.
Abstract:
PURPOSE: A method and an apparatus for encoding and decoding audio signal are provided to offer the sound with sense of realism by supporting the play of the multi-channel audio signal. CONSTITUTION: A receiver(110) receives one signal among the multi-channel audio signal and the first audio signal. A first encoding unit(120) extracts spatial parameter from the multi-channel audio signal, mixes the multi-channel audio signal, and generates the second audio signal. A secondary symbol stoker(130) encodes at least one of the first and the second audio signal, and generates the encoded audio signal. A multiplexer(140) multiplexes the encoded audio signal as described above and spatial parameter to generate the satellite DMB(Digital Multimedia Broadcasting) stream.
Abstract:
본 발명은 인간이 음원의 변위를 인지하는 임계치를 이용하여 멀티채널 오디오 신호를 채널별로 제어하여 사용자에게 역동적인 멀티채널 오디오 서비스를 제공하는 것을 목적으로 한다. 본 발명에 의한 멀티채널 오디오 신호를 전송하는 장치는 멀티채널 오디오 신호를 부호화하여 멀티채널 오디오 스트림을 생성하는 멀티채널 오디오 부호화기와, 멀티채널 오디오 신호의 장면을 표현하는 멀티채널 오디오 제어정보를 부호화하여 장면표현언어 스트림을 생성하는 장면표현언어 부호화기와, 상기 멀티채널 오디오 스트림과 상기 장면표현언어 스트림을 다중화하는 다중화기를 포함하고, 상기 멀티채널 오디오 제어정보는 상기 멀티채널 오디오 신호를 구성하는 각 채널 신호를 개별적으로 제어하는 데이터를 포함하고, 상기 채널 신호를 개별적으로 제어하는 데이터는 채널 수, 각 채널 신호의 수평 위치, 각 채널 신호의 수직 위치, 각 채널 신호의 수평방향 변이속도, 각 채널 신호의 수직방향 변이속도 중 적어도 하나를 포함한다.
Abstract:
PURPOSE: A multi-object audio encoding device for supporting a post downmix signal and a decoding device thereof are provided to create downmix information parameters distributed based on 0dB and perform quantization/inverse quantization. CONSTITUTION: An object information extraction and downmix generation unit(201) creates a downmix signal and object information from an input object. A parameter determining unit(202) includes a power offset calculating part which scales the post downmix signal into the preset value, and a parameter extracting part which extracts a downmix information parameter from the scaled post downmix signal in the specific frame. A bitstream generating unit(203) creates an object bit stream by combining the downmix information parameter and the object information.
Abstract:
PURPOSE: An apparatus and a method for encoding and decoding an integrated voice and music signal are provided to effectively select internal modules according to a characteristic of an input signal, thereby providing excellent sound quality to both a voice signal and a music signal at various bit rates. CONSTITUTION: An input signal analysis unit(110) analyzes a characteristic of an input signal. When the input signal is a music characteristic signal, the first conversion encoding unit(120) converts the input signal into a frequency domain to encode. When the input signal is a voice characteristic signal, an LPC(Linear Predictive Coding) encoder encodes the input signal based on LPC. A bit stream generator(140) uses output signals of the first conversion encoding unit and the LPC encoder to generate a bit stream.
Abstract:
PURPOSE: An apparatus for determining a signal state of an audio signal is provided to suitably select a voice encoder based on LPC(Linear Predictive Coding) and an audio encoder based on conversion according to a characteristic of an input signal. CONSTITUTION: A signal state observer(101) classifies characteristics of an input signal to output each state observation probability. A state chain unit(102) outputs a state identifier of a frame of the input signal based on the state observation probability. An encoder encoding a frame of the input signal is determined according to the state identifier. The signal state observer comprises a characteristic extracting unit, an entropy base determining tree and a silence state determining unit.
Abstract:
1. 청구범위에 기재된 발명이 속한 기술분야 본 발명은 변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화 장치 및 그 방법에 관한 것임. 2. 발명이 해결하려고 하는 기술적 과제 본 발명은 입력된 오디오 신호를 선형예측 부호화해서 구한 오차 신호를 그 오차 신호의 마스킹 임계치(이하, 오차 마스킹 임계치)를 이용하여 부호화하고, 부호화된 비트열을 복호화해서 구한 오차 신호를 선형예측 부호화정보(선형 예측 분석 계수)를 이용하여 선형예측 복호화함으로써, 오디오 부호화의 압축 효율을 향상시킬 수 있게 하는, 변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화 장치 및 그 방법을 제공하는데 그 목적이 있음. 3. 발명의 해결방법의 요지 본 발명은, 변형 선형예측 부호화를 이용한 오디오 부호화 장치에 있어서, 외부로부터 입력된 오디오 신호(원신호)를 시간 영역에서 선형예측 부호화하여 오차 신호를 구하기 위한 오차 신호 계산 수단; 상기 오차 신호 계산 수단에서 구한 오차 신호를 주파수 영역 신호로 변환하기 위한 주파수 영역 변환 수단; 상기 원신호와 상기 원신호의 선형예측 부호화에 사용된 부호화 정보를 이용해서, 상기 오차 신호의 부호화에 사용되는 마스킹 임계치를 구하기 위한 마스킹 임계치 계산 수단; 및 상기 주파수 영역 변환 수단에서 변환된 오차 신호를 상기 구한 마스킹 임계치 를 이용하여 지각적 부호화하기 위한 지각적 부호화 수단을 포함함. 4. 발명의 중요한 용도 본 발명은 변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화 등에 이용됨. 변형 선형예측 부호화(WLPC), 고급 오디오 부호화(AAC), 심리음향 모델(PAM), 오디오 압축, 지각적 부호화, 마스킹 임계치
Abstract:
오디오 신호의 무손실 부호화/복호화 장치 및 그 방법이 개시된다. 오디오 신호의 무손실 부호화 장치는 제1 심볼을 직접 부호화하는 제1 부호화기, 제1 심볼을 제2 심볼로 변환하고, 제2 심볼을 부호화하는 복수의 제2 부호화기를 포함하는 제2 부호화기 모듈, 제1 부호화기와 복수의 제2 부호화기의 성능을 비교하고, 비교 결과에 따라서 부호화 모드를 출력하는 제1 선택기, 및 부호화 모드에 대응하여 제1 심볼을 부호화하여 출력하는 제2 선택기로 이루어진다. 이에 따르면, 오디오 신호의 부호화 성능을 향상시킬 수 있다.
Abstract:
An apparatus and a method for multi-stage conversion are provided to use multi-dimension conversion or multi-stage conversion to raise the compression efficiency of energy and improve the coding performance. Input image data are DCT(Discrete Cosine Transform)-converted, and R blocks are selected from the DCT-converted image data. In selected R blocks, transform coefficients of the same frequency are one-dimensionally arranged. The one-dimensionally arranged transform coefficients are one-dimensionally converted. The R blocks are selected from the DCT-converted image data in a horizontal direction, a vertical direction, or a diagonal direction.