Abstract:
본 발명은 멀티채널 오디오 신호 부호화 및 복호화 방법에 관한 것으로서, 그 부호화방법은 오디오 데이터를 계층적으로 부호화하는 단계; 오디오 데이터가 부호화된 페이로드가 종결되었다는 것을 나타내는 식별 코드를 생성하는 단계; 확장 데이터의 페이로드가 시작되었다는 것을 나타내는 식별 코드를 생성하는 단계; 오디오 데이터의 채널을 멀티 채널로 확장하는 확장 데이터의 타입을 생성하는 단계; 및 부호화된 오디오 데이터의 각 계층에 대응하도록 멀티 채널로 확장하는 확장 데이터를 계층적으로 부호화하는 단계를 포함한다. 본 발명에 의하면, 하나의 비트스트림으로 사용자 환경에 따라서 모노, 스테레오, 멀티채널을 제공할 수 있다. 멀티 채널에서도 사용자의 단말 및 네트워크 상태에 따라서 FGS 기능을 제공한다. 또한 멀티채널 BSAC의 성능 향상, 예를 들어 고음질, 낮은 복잡도, 확장성 확보를 가능하게 한다. 특히, MPEG 표준화를 위한 여러 요구사항(기존의 BSAC 와의 호환성, 미세계층(FGS) 기능 유지, 최소한의 수정)을 충족시킬 수 있다. 그리고 고현실감 디지털 멀티미디어 방송, 모바일 및 홈 시어터(home theater) 기반 서비스에서 유용하게 사용될 수 있다.
Abstract:
본 발명은 스케일러블 오디오 복/부호화 방법 및 장치에 관한 것으로서, 그 부호화 방법은 시간/주파수 맵핑부, 심리음향부, 양자화부, 비트율 조절이 가능한 계층적 구조를 가진 비트스트스림을 생성해주는 비트패킹부로 구성된 오디오 부호화기의 오디오 부호화 방법에 있어서 비트패킹부의 부호화할 데이터를 비트플레인 상에 매핑하는 과정; 소정 판단기준을 통해 부호화할 비트플레인을 선택하는 과정; 및 선택된 비트플레인의 데이터를 무손실 부호화하는 과정을 포함함을 특징으로 하며, 비트율이 조절 가능하도록 계층적으로 부호화된 비트스트림으로부터 무손실 복호화하고 양자화 스텝사이즈 정보로 역양자화하고 역주파수/시간 매핑부를 거쳐 복호화된 오디오 신호생성방법 중 무손실 복호화 방법은 부가정보를 통해 비트 플레인 구조를 정의하는 과정; 적절한 판단기준을 통해 복호화할 비트플레인을 선택하는 과정; 및 무손실 복호화를 통해 선택된 비트플레인의 데이터를 복원하는 과정을 포함한다. 본 발명에 의하면, 추가의 부가정보 없이 일부 비트스트림만을 이용하여 복호화시 부호화 순서를 변경함에 따른 음질 개선할 수 있으며 지각적으로 최적화된 음질 제공할 수 있다.
Abstract:
무손실 오디오 부호화/복호화 방법 및 장치가 개시된다. 그 부호화 방법은 시간영역의 오디오 신호를 정수값을 갖는 주파수 영역의 오디오 스펙트럴 신호로 변환하는 신호변환단계; 주파수영역의 오디오 신호를 주파수에 따른 비트플레인 신호로 맵핑하는 맵핑단계; 및 비트플레인을 구성하는 이진 샘플에 대해, 소정의 문맥을 이용하여 결정된 확률모델을 통해 무손실부호화하는 무손실부호화단계를 포함함을 특징으로 한다. 그리고 그 복호화 방법은 오디오 비트스트림을 역다중화하여 소정의 손실부호화된 손실비트스트림과 상기 에러데이터의 에러비트스트림을 추출하는 단계; (bb) 상기 추출된 손실비트스트림을 소정의 손실복호화하는 단계; 추출된 에러비트스트림을 무손실복호화하는 단계; 복호화된 손실비트스트림과 에러비트스트림을 이용하여 주파수 스펙트럴 신호로 복원하는 단계; 및 주파수 스펙트럴 신호를 역 정수 시간/주파수변환하여 시간영역의 오디오 신호를 복원하는 단계를 포함함을 특징으로 한다. 본 발명에 의하면, 입력의 분포에 관계없이 통계적인 분포를 통하여 만들어진 모델을 통해 최적의 성능을 제공하며, 문맥기반 부호화 방식을 통하여 BPGC보다 우월한 압축률 제공한다.
Abstract:
PURPOSE: A method and a device for encoding/decoding a multi channel signal are provided to remove overlapped information among multi channels without using a down-mix signal, thereby encoding/decoding a residual signal. CONSTITUTION: A reference signal encoding unit(220) selects and encodes a reference signal which is a reference for encoding among multichannel signals. A phase difference encoding unit(235) calculates and encodes a phase difference of each multichannel signal about the reference signal. A gain value encoding unit(240) calculates and encodes a ratio of each multichannel signal to the reference signal by the gain value. A residual signal encoding unit(245) extracts and encodes a residual signal corresponding to the difference between a predicted multichannel signal and a real multichannel signal. The multichannel signal applies and predicts the phase difference and the gain value to the reference signal.
Abstract:
본 발명은 오디오 신호를 부호화하거나 복호화하는 방법 및 장치에 관한 것으로, 고주파수 신호를 부호화하거나 복호화하는데 이용되는 노이즈-플로어 레벨(noise-floor level)을 신호에 포함된 유성음 또는 무성음의 정도에 따라 갱신하여 부호화하거나 복호화한다.
Abstract:
본 발명은 멀티 채널 신호의 복호화 방법에 관한 것으로, 멀티 채널 신호를 대표하는 다운믹스된 신호를 복원하고, 멀티 채널 신호의 채널 간의 특성 관계를 나타내는 파라미터들을 복원하며, 복원된 파라미터들을 이용하여 추가적인 파라미터를 추정하고, 복원된 파라미터들 및 추정된 파라미터를 이용하여 복원된 다운믹스된 신호를 업믹싱함으로써 멀티 채널 신호를 복원한다.
Abstract:
오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를 이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치가 개시된다. 그 오디오 신호의 중요주파수 성분 추출방법은 주파수 영역으로 변환된 오디오 신호에 대해 심리음향모델을 이용하여 SMR 값을 계산하는 단계; 마스킹 역치가 주파수 영역의 오디오 신호보다 작은 주파수의 신호를 중요주파수 성분으로 선택하는 단계; 및 상기 중요주파수 성분으로 선택된 오디오 신호들 중에서 소정의 가중치를 고려하여 스펙트럼 피크를 추출하여 중요주파수 성분으로 선택하는 단계를 포함함을 특징으로 한다. 본 발명에 의하면, 지각적으로 중요한 주파수 성분을 효율적으로 부호화하여 저비트율에서 고음질을 제공할 수 있다. 또한 심리음향 모델을 통하여 지각적으로 중요한 성분을 추출하며, 위상정보없이 부호화가 가능하고, 저비트율에서 효율적인 스펙트럼 신호를 표현할 수 있다. 또한 본 발명은 저비트율 오디오 부호화 방식이 필요한 모든분야에 응용가능하며, 차세대 오디오 방식으로 적용가능하다.
Abstract:
A method and an apparatus for bandwidth extension encoding and decoding are provided to encode and decode a high frequency band signal using a low frequency band signal, thereby preventing the deterioration of sound quality while performing encoding and decoding using the small amount of data. A band division unit(100) divides an input signal into a low frequency band signal and a high frequency band signal. A domain determination unit(105) determines a domain to be encoded in a frequency domain and a temporal domain for the low frequency band signal. A frequency domain encoder(110) converts the low frequency band signal into a frequency domain, adjusts noise, quantizes the low frequency band signal, and encodes the low frequency band signal losslessly if it is determined that the low frequency band signal is encoded in the frequency domain. A temporal domain encoder(130) encodes the low frequency band signal in a CELP(Code Excited Linear Prediction) method if it is determined that the low frequency band signal is encoded in the temporal domain. A converter(135,140) converts the low frequency band signal and the high frequency band signal by a predetermined transform. A bandwidth expansion encoder(145) encodes the converted high frequency band signal using the converted low frequency band signal. A stereo tool encoding unit(150) analyzes an input signal inputted through an input terminal(IN) by a stereo tool and encodes information for generating a stereo signal at a decoding terminal.
Abstract:
A method and an apparatus for classifying an audio signal and a method and an apparatus for coding/decoding an audio signal using the same are provided to restrain a mode from being oscillated at frame intervals, improve tolerance with respect to a noise signal, and restore an audio signal naturally. A short-term feature generating unit(120) analyzes an audio signal by frames to generate a short-term feature. The first and second long-term feature generating units(140,150) generate long-term features by using the generated short-term feature. A classification reference value adjusting unit(180) adaptively adjusts a classification reference value of a frame desired to be classified by using the generated long-term feature. A classifying unit(190) classifies the frame desired to be classified by using the adaptively adjusted classification reference value. A long-term feature comparing unit(170) compares the long-term feature of the classified frame with a certain threshold value.
Abstract:
A method and an apparatus for encoding and decoding an audio signal by using bandwidth extension technique and stereo encoding technique are provided to output encoded stereo parameters, bitplane and bandwidth extension information as an encoded result in response to an input signal, thereby encoding high frequency components and stereo components efficiently at a limited bit rate to improve sound quality. A method for encoding an audio signal comprises the following steps of: extracting stereo parameters from an input signal and performing the down-mixing of the input signal(1300); dividing the down-mixed signal into a low frequency band signal and a high frequency band signal(1310); converting the high frequency band signal and the low frequency band signal from a time domain to a frequency domain separately(1320); quantizing the converted low frequency band signal to encode the low frequency band signal into bitplane(1330); generating and encoding bandwidth extension information indicating a characteristic of the converted high frequency band signal by using the converted low frequency band signal(1340); and outputting the encoded stereo parameters, bitplane and bandwidth extension information as an encoded result in response to the input signal(1350).