Abstract:
본 발명에 따른 기존 오디오 포맷의 오디오 장면 정보를 유지하는 WFS 재생 방법 및 그 장치는, WFS 재생을 위해 별도로 마련된 오디오 객체들이 존재하지 않는, 현존하는 오디오 포맷을 입력 신호로 받아 각 음원 객체와 그 객체의 공간 상 음상 정위 정보를 제공해줌으로써 WFS 렌더링을 가능하게 하는 방법에 관한 것이다. 즉, 처음부터 WFS 재생을 위해 음원 객체를 독립적으로 보유하고 있는 상황이라면 문제가 없지만, WFS 재생 시스템의 하위 호환성을 고려한다면 스테레오나 5.1채널 오디오 포맷을 입력 받아도 WFS로 재생해줄 수 있어야 하므로 스테레오나 5.1채널 오디오 신호에 음원 분리 기법을 적용하여 채널별 신호에 포함되어 있는 각각의 음원 객체를 추출해낸 후, 이를 채널 별로 짝을 지어 파워 패닝 기법을 활용하여 WFS 렌더링(Rendering) 시 발생하는 원래 음장의 왜곡 현상을 해결하고자 하는 것이다. WFS(Wave Field Synthesis), 음장 합성, BSS(Blind Source Extraction)
Abstract:
본 발명은 오디오 송수신 시스템에 관한 것으로, 더욱 구체적으로는 동일한 특성을 갖는 오디오 객체를 패킷화하는 객체기반 오디오 콘텐츠 송수신 방법 및 그 장치에 관한 것이다. 이를 위해 본 발명은 입력되는 각각의 ES를 기 설정된 공통정보로 필터링하는 단계, 상기 필터링된 각각의 ES에 패킷헤더를 부가하여 ES 패킷을 생성하는 단계, 상기 생성된 ES 패킷들을 취합한 후, 다객체 패킷헤더를 부가하여 객체패킷을 생성하는 단계, 및 상기 생성된 객체패킷을 다중화하여 전송 매체에 따라 패킷화한 후 전송하는 단계를 포함한다. ES(Elementary Stream), 패킷헤더. 다객체 패킷헤더, 객체패킷, 객체기반.
Abstract:
PURPOSE: An apparatus for encoding and decoding integrated voice and audio signals is provided to combine a voice codec module with an audio codec module and selectively apply a codec module depending on a characteristic of an input signal, thereby showing excellent performance. CONSTITUTION: A module selecting unit(110) analyzes a characteristic of an input signal to select the first encoding module for encoding the first frame of an input signal. A voice encoding unit(130) encodes the input signal by selection of the module selecting unit to generate a voice bit string. An audio encoder(140) encodes the input signal by selection of the module selecting unit to generate an audio bit string. A bit stream generator(150) generates an output bit string from the audio encoder by selection of the module selecting unit.
Abstract:
본 발명은 음원 간 상호상관을 이용한 멀티트랙 다운믹싱 장치 및 그 방법에 관한 것으로, 개별 음원 신호를 각 음원 간 상호상관을 이용하여 상호상관 값이 높은 조합을 가지는 멀티트랙 신호로 다운믹싱함으로써, 다운믹싱된 멀티트랙 신호로부터 개별 음원을 더욱 충실하게 복원할 수 있는, 음원 간 상호상관을 이용한 멀티트랙 다운믹싱 장치 및 그 방법을 제공하고자 한다. 이를 위하여, 본 발명은 멀티트랙 다운믹싱 장치에 있어서, 개별 음원 신호를 주파수 대역으로 변환하기 위한 신호 변환 수단; 상기 변환된 개별 음원 신호로부터 각 음원 간 공간정보를 산출하기 위한 공간정보 산출 수단; 상기 산출된 각 음원 간 공간정보를 이용하여 상호상관 값에 따라 믹싱조합 정보를 결정하기 위한 믹싱조합 결정 수단; 및 상기 결정된 믹싱조합 정보에 따라 상기 변환된 개별 음원 신호를 멀티트랙 신호로 다운믹싱하기 위한 멀티트랙 다운믹싱 수단을 포함한다. 상호상관, 멀티트랙, 개별 음원 신호, 공간정보, 믹싱조합, 폐루프, 믹싱 매트릭스 정보, 멀티트랙 다운믹싱
Abstract:
본 발명은 객체기반 오디오 서비스 제공 방법과, 이를 위한 다중객체 오디오 콘텐츠 파일의 생성/편집/재생 방법 및 그 파일 구조에 관한 것으로서, 객체 기반 오디오 서비스에 부가 서비스로서 오디오 프리셋에 관련된 이미지/영상/문자 등과 같은 비주얼 데이터 형태의 부가 데이터를 추가로 제공함으로써, 사용자가 자신의 취향에 따라 다양한 오디오 콘텐츠를 저작/편집할 수 있도록 하고자 한다. 이를 위하여, 본 발명은, 객체기반 오디오 서비스 제공 방법에 있어서, 오디오 콘텐츠를 구성하는 복수의 오디오 객체를 생성하는 단계; 상기 각각의 오디오 객체에 대하여 객체 속성을 정의한 오디오 프리셋을 생성하는 단계; 및 상기 오디오 객체, 상기 오디오 프리셋, 및 상기 오디오 프리셋에 관련된 부가 데이터를 다중화하여 전송하는 단계를 포함하는 것을 특징으로 한다. 객체기반 오디오, 오디오 객체, 다중객체 오디오 콘텐츠 파일, 부가 데이터, 부기데이터 색인정보
Abstract:
A method for encoding/decoding a multi-object and an apparatus therefor are provided to offer various audio services to a user, efficiently. The first down-mix generating unit(102) down-mixes a background object(BGO) and the first foreground object(FGO1) to generate the first down-mix signal and the first residual signal. The second down-mix generating unit(103) down-mixes the first down-mix signal and the second foreground object(FGO2) to generate the second down-mix signal and the second residual signal. A bit stream generating unit produces a bit stream including the down-mix signal and residual signal.
Abstract:
An apparatus and a method for encoding and decoding multi-object audio signal including multiple channels are provided to actively consume audio contents according to the need of a user. An SAOC(Spatial Audio Object Coding) encoder(101) downmixes an audio object outputted from an SAC encoder(103) to output a representative downmix signal, and outputs an SAOC bit stream including space queue information and supplementary information about the inputted audio object. The SAC encoder downmixes a multi-channel audio signal into a mono channel or a stereo channel to generate a single audio object. The SAC encoder outputs an SAC bit stream including space queue information and supplementary information about the inputted multi-channel audio signal. A preset-ASI(Audio Scene Information) unit(113) forms a control signal inputted from the exterior, namely, object control information, into preset-ASI and generates a preset-ASI bit stream including the preset-ASI information. A bit stream formatter(105) generates a representative bit stream by combining the SAOC bit stream outputted from the SAOC encoder, the SAC bit stream outputted from the SAC encoder, and a preset-ASI bit stream outputted from the preset-ASI unit.
Abstract:
An apparatus and a method for encoding and decoding multi-object audio signals with various channels are provided to allow a user to use audio contents actively as necessary. The first and second downmixers(101,103) downmix multi-object audio signals each with different channels into a single downmixed signal, and extract supplementary information including header information and space queue information with respect to the multi-object audio signals each having different channels. An audio encoder(105) encodes the downmixed audio signals. A supplementary information encoder(107) generates the supplementary information as a bit stream. The header information includes identifier information of the multi-object audio signals each with different channels and channel information of the multi-object audio signals each with different channels and channel information.
Abstract:
An apparatus and a method of surround sound field visualization using a spatial sound localization cue are provided to monitor the arrangement and power balance of a sound source when making multi-channel audio contents by intuitively displaying the present state of the sound source. A sub-band analysis unit(101) represents an inputted multi-channel audio signal as a frequency domain, and divides the frequency domain into sub-bands. A channel power calculating unit(102) calculates the power of a signal for each sub-band. A maximum channel detecting unit(103) compares the power of sub-bands of each channel, and determines at least two channels with the maximum power for each sub-band. An inter-channel cross correlation calculating unit(104) calculates the cross correlation for each adjacent channel and right/left channels. A sound source direction and power calculating unit(105) calculates the direction and power of a sound source by using the information of at least two channels determined by the maximum channel detecting unit and the cross correlation value calculated by the inter-channel cross correlation calculating unit. A surround sound field visualization unit(106) displays the power and direction of the sound source in a display device.
Abstract:
1. 청구범위에 기재된 발명이 속한 기술분야 본 발명은 혼합된 오디오 스트림으로부터 오디오 객체를 분리하기 위한 단말 장치 및 그 방법에 관한 것임. 2. 발명이 해결하려고 하는 기술적 과제 본 발명은 하나의 기본 스트림으로 압축된 다수의 오디오 객체들을 BIFS를 이용하여 분리 처리할 수 있는 노드 구조를 제안하고, 그 제안한 노드를 이용하여 혼합된 오디오 스트림으로부터 오디오 객체를 분리하기 위한 단말 장치 및 그 방법을 제공하는데 목적이 있음. 3. 발명의 해결방법의 요지 본 발명은, 다수의 오디오 객체가 압축된 기본 스트림(ES)을 디코딩하기 위한 디코딩부; 및 오디오 객체 분리 노드를 이용하여 상기 디코딩된 오디오 스트림에서 오디오 객체들을 분리하고, 분리된 오디오 객체들을 이용하여 오디오 장면을 구성하기 위한 컴포지터를 포함하는 단말 장치로서, 상기 오디오 객체 분리 노드는, 분리하고자 하는 오디오 객체의 수를 기술하는 필드; 및 객체 분리를 수행할지 여부를 기술하는 필드를 포함함. 4. 발명의 중요한 용도 본 발명은 MPEG-4 시스템 등에 이용됨. MPEG-4, BIFS, 객체, 기본 스트림(ES), 오디오 장면, 분리