Abstract:
PURPOSE: A bitstream structure method for an object based audio service, a bitstream structure device thereof, and a bitstream encoding device thereof are provided to designate an upper value and a lower value of a reproduction volume value of a sound source separated from a bitstream, thereby minimizing deterioration of sound quality corresponding to excessive control of sound volume. CONSTITUTION: A bitstream structure device comprises a bitstream by separating a file header and a frame of an audio object separated through sound source separation(110). The bitstream structure device stores reproduction level information for reproducing the audio object in the file header(120). The bitstream structure device stores preset information for reproducing the audio object in the file header(130). [Reference numerals] (110) Forming by a bitstream by separating a file header and a frame of au audio object separated through sound source separation; (120) Storing reproduction level information for reproducing the audio object in the file header; (130) Storing preset information for reproducing the audio object in the file header; (AA) Start; (BB) End;
Abstract:
본 발명은 LPC(Linear Predictive Coding) 기반(혹은 CELP(Code Excitation Linear Prediction) 기반)의 음성(혹은 오디오) 부호화기와 변환(transform) 기반의 오디오 부호화기를 입력 신호의 특징에 따라 적절하게 선택할 수 있는 모듈은 기존의 LPC 기반의 부호화기와 오디오 부호화기의 성능의 장벽을 메워 주기 위한 다리(bridge) 역할을 하는 모듈이며, 이를 통하여, 입력 오디오 신호의 종류와 상관없이 일관된 오디오 품질을 제공할 수 있는 통합 오디오 부호화기 설계가 가능하다. 오디오 신호, 상태결정
Abstract:
PURPOSE: An encoding and decoding apparatus for a multi-object audio signal and method thereof are provided to restore a re-downloading and mixing signal outputted from a signal processing unit or a down-mixing signal outputted from an SAOC(Spatial Audio Object Coding) encoder as a multi-object audio signal of various channels. CONSTITUTION: A transcoder(103) creates an MPS(MPEG Surround) bit stream including a spatial queue information for a spatial audio signal based on rendering information for the multi-object audio signal inputted from the outside or a bit stream which is transmitted from an encoder(101) and includes the rendering information for the multi-object audio signal. A signal processor(803) adaptively converts the encoded multi-object audio signal according to an MPS decoding method based on the inputted rendering information or the transmitted bit stream. [Reference numerals] (101) SAOC encoder; (103) Transcoder; (105) HPS decoder; (201) HPS encoder; (203) Preset ASI unit; (205) Bit stream formatter; (803) Signal processing unit; (AA,GG) Object 1; (BB,HH) Object 2; (CC) Object 3; (DD) Representative down mix signal; (EE) Representative re-down mix signal; (FF) Output multi-channel audio signal; (II) Object M; (JJ) Object N; (KK) Down mix signal; (LL) Preset ASI bit stream; (MM) SAOC bit stream; (NN) SAC bit stream; (OO) Representative SAOC bit stream; (PP) Representative HPS bit stream; (QQ) Object control information; (RR) Object control information playback system information
Abstract:
PURPOSE: A device for encoding/decoding an integrated voice/music signal is provided to extend a frequency band before conversion of a sampling rate, thereby drastically extending the frequency band. CONSTITUTION: A sampling rate converting unit converts a sampling rate about an input signal whose frequency band is extended. When the input signal is a signal with a voice feature, a voice signal encoding unit(150) encodes the input signal. When the input signal is a signal with a music feature, a music signal encoding unit(160) encodes the input signal. A bit stream generating unit(170) generates a bit stream using an output signal encoded by the voice signal encoding unit and an output signal encoded by the music signal encoding unit.
Abstract:
객체기반 오디오 파일 제공 장치 및 재생 장치, 그리고, 객체기반 오디오 파일 제공 방법 및 객체기반 오디오 재생 방법이 개시된다. 객체기반 오디오 파일 제공 장치는 복수의 오디오 객체별 프레임 및 객체기반 오디오 서비스를 위한 파일 헤더를 포함하는 객체기반 오디오 파일에 대한 비트스트림을 생성하는 비트스트림 생성부; 및 상기 비트 스트림을 객체기반 오디오 파일 재생 장치에 전송하는 비트스트림 전송부를 포함하고, 상기 오디오 객체별 프레임은, 복수의 오디오 객체 전체를 믹싱한 음원이 기록된 프레임 및 상기 복수의 오디오 객체들 각각이 기록된 프레임으로 구성될 수 있다.
Abstract:
PURPOSE: An apparatus and method for processing window for interlocking between MDCT-TCX(Modified Discrete Cosine Transform-Transform Coded Excitation) frame and CELP(Coded Excited Linear Prediction) frame are provided to enable improved coding performance in a low bit rate by determining a window applied to a current sub frame if the coding mode of a preceding subframe or a subsequent subframe is in a CELP. CONSTITUTION: A window processing apparatus comprises: a coding mode decision unit(201) for deciding a preceding subframe coding mode and a subsequent subframe coding mode, with respect to a current subframe; and a window application unit(202) for applying a window that is determined according to the preceding subframe coding mode and the subsequent subframe coding mode, to the current subframe.
Abstract:
본 발명은 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법에 관한 것으로, 주파수 확장(Bandwidth extension)에 필요한 고대역(High-band)의 톤 성질(Tonality)을 보정하기 위해 고대역 잡음레벨을 결정함에 있어서, 입력 신호의 피치(Pitch) 주파수에 따라 가변적으로 고대역 잡음레벨을 조정함으로써, 고대역 잡음레벨을 정확하게 측정할 수 있으며 고대역 신호의 품질을 향상시킬 수 있게 하는, 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법을 제공하고자 한다. 이를 위하여, 본 발명은 가변 잡음레벨 결정 장치에 있어서, 주파수 확장을 위한 고대역 잡음레벨을 입력 신호의 톤 성질에 따라 결정하기 위한 잡음레벨 결정 수단; 상기 입력 신호의 피치 주파수를 검출하고 상기 검출된 피치 주파수와 주파수 채널과의 상관 관계를 분석하기 위한 피치 주파수 분석 수단; 및 상기 분석된 피치 주파수와 주파수 채널과의 상관 관계를 기초로 하여 상기 결정된 고대역 잡음레벨을 가변적으로 조정하기 위한 잡음레벨 조정 수단을 포함한다. 주파수 확장, 고대역, 톤 성질, 고대역 잡음레벨, 피치 주파수
Abstract:
PURPOSE: An apparatus for compensating a low frequency band audio signal based on listener characteristics is provided to reproduce a high quality of audio signal based on the listening characteristics of a listener. CONSTITUTION: A frequency band division unit(110) divides a frequency band of an audio signal into plural sub-frequency bands, and an auditory characteristic information storage unit(140) stores auditory characteristic information on auditory frequency range of a listener and minimum recognition volume information for an audio signal of each sub frequency band of a listener. A low band compensating unit(150) controls the volume of an audio signal within an auditory frequency range based on auditory characteristic information to be maintained over the minimum recognition volume information.
Abstract:
PURPOSE: A device for encoding/decoding a multi-object audio signal comprising various channels additional information bit stream conversion is provided to consume audio contents actively according to the necessity of a user by efficiently performing encoding and decoding operations for the multi-object audio contents of various channels. CONSTITUTION: An SAC(Spatial Audio Coding) encoder outputs one audio object from a multi-channel audio signals, and a bit stream formatter(205) creates a representative SAOC(Spatial Audio Object Coding) bits stream. A transcoder(103) performs the representative SAOC bit stream into a representative SAC bit stream. An SAC decoder(105) stores the down-mix signal of an SAOC encoder(101) into a multi-object audio signal through the SAC bit stream.