Abstract:
본 발명은 객체기반 오디오 서비스 제공 방법과, 이를 위한 다중객체 오디오 콘텐츠 파일의 생성/편집/재생 방법 및 그 파일 구조에 관한 것으로서, 객체 기반 오디오 서비스에 부가 서비스로서 오디오 프리셋에 관련된 이미지/영상/문자 등과 같은 비주얼 데이터 형태의 부가 데이터를 추가로 제공함으로써, 사용자가 자신의 취향에 따라 다양한 오디오 콘텐츠를 저작/편집할 수 있도록 하고자 한다. 이를 위하여, 본 발명은, 객체기반 오디오 서비스 제공 방법에 있어서, 오디오 콘텐츠를 구성하는 복수의 오디오 객체를 생성하는 단계; 상기 각각의 오디오 객체에 대하여 객체 속성을 정의한 오디오 프리셋을 생성하는 단계; 및 상기 오디오 객체, 상기 오디오 프리셋, 및 상기 오디오 프리셋에 관련된 부가 데이터를 다중화하여 전송하는 단계를 포함하는 것을 특징으로 한다. 객체기반 오디오, 오디오 객체, 다중객체 오디오 콘텐츠 파일, 부가 데이터, 부기데이터 색인정보
Abstract:
A method for encoding/decoding a multi-object and an apparatus therefor are provided to offer various audio services to a user, efficiently. The first down-mix generating unit(102) down-mixes a background object(BGO) and the first foreground object(FGO1) to generate the first down-mix signal and the first residual signal. The second down-mix generating unit(103) down-mixes the first down-mix signal and the second foreground object(FGO2) to generate the second down-mix signal and the second residual signal. A bit stream generating unit produces a bit stream including the down-mix signal and residual signal.
Abstract:
An apparatus and a method for encoding and decoding multi-object audio signal including multiple channels are provided to actively consume audio contents according to the need of a user. An SAOC(Spatial Audio Object Coding) encoder(101) downmixes an audio object outputted from an SAC encoder(103) to output a representative downmix signal, and outputs an SAOC bit stream including space queue information and supplementary information about the inputted audio object. The SAC encoder downmixes a multi-channel audio signal into a mono channel or a stereo channel to generate a single audio object. The SAC encoder outputs an SAC bit stream including space queue information and supplementary information about the inputted multi-channel audio signal. A preset-ASI(Audio Scene Information) unit(113) forms a control signal inputted from the exterior, namely, object control information, into preset-ASI and generates a preset-ASI bit stream including the preset-ASI information. A bit stream formatter(105) generates a representative bit stream by combining the SAOC bit stream outputted from the SAOC encoder, the SAC bit stream outputted from the SAC encoder, and a preset-ASI bit stream outputted from the preset-ASI unit.
Abstract:
An apparatus and a method for encoding and decoding multi-object audio signals with various channels are provided to allow a user to use audio contents actively as necessary. The first and second downmixers(101,103) downmix multi-object audio signals each with different channels into a single downmixed signal, and extract supplementary information including header information and space queue information with respect to the multi-object audio signals each having different channels. An audio encoder(105) encodes the downmixed audio signals. A supplementary information encoder(107) generates the supplementary information as a bit stream. The header information includes identifier information of the multi-object audio signals each with different channels and channel information of the multi-object audio signals each with different channels and channel information.
Abstract:
An apparatus and a method of surround sound field visualization using a spatial sound localization cue are provided to monitor the arrangement and power balance of a sound source when making multi-channel audio contents by intuitively displaying the present state of the sound source. A sub-band analysis unit(101) represents an inputted multi-channel audio signal as a frequency domain, and divides the frequency domain into sub-bands. A channel power calculating unit(102) calculates the power of a signal for each sub-band. A maximum channel detecting unit(103) compares the power of sub-bands of each channel, and determines at least two channels with the maximum power for each sub-band. An inter-channel cross correlation calculating unit(104) calculates the cross correlation for each adjacent channel and right/left channels. A sound source direction and power calculating unit(105) calculates the direction and power of a sound source by using the information of at least two channels determined by the maximum channel detecting unit and the cross correlation value calculated by the inter-channel cross correlation calculating unit. A surround sound field visualization unit(106) displays the power and direction of the sound source in a display device.
Abstract:
1. 청구범위에 기재된 발명이 속한 기술분야 본 발명은 혼합된 오디오 스트림으로부터 오디오 객체를 분리하기 위한 단말 장치 및 그 방법에 관한 것임. 2. 발명이 해결하려고 하는 기술적 과제 본 발명은 하나의 기본 스트림으로 압축된 다수의 오디오 객체들을 BIFS를 이용하여 분리 처리할 수 있는 노드 구조를 제안하고, 그 제안한 노드를 이용하여 혼합된 오디오 스트림으로부터 오디오 객체를 분리하기 위한 단말 장치 및 그 방법을 제공하는데 목적이 있음. 3. 발명의 해결방법의 요지 본 발명은, 다수의 오디오 객체가 압축된 기본 스트림(ES)을 디코딩하기 위한 디코딩부; 및 오디오 객체 분리 노드를 이용하여 상기 디코딩된 오디오 스트림에서 오디오 객체들을 분리하고, 분리된 오디오 객체들을 이용하여 오디오 장면을 구성하기 위한 컴포지터를 포함하는 단말 장치로서, 상기 오디오 객체 분리 노드는, 분리하고자 하는 오디오 객체의 수를 기술하는 필드; 및 객체 분리를 수행할지 여부를 기술하는 필드를 포함함. 4. 발명의 중요한 용도 본 발명은 MPEG-4 시스템 등에 이용됨. MPEG-4, BIFS, 객체, 기본 스트림(ES), 오디오 장면, 분리
Abstract:
1. 청구범위에 기재된 발명이 속한 기술분야 본 발명은 객체기반의 오디오를 서비스하기 위한 객체기반 오디오 전송/수신 시스템 및 그 방법에 관한 것임. 2. 발명이 해결하려고 하는 기술적 과제 본 발명은 사용자에게 편집자가 의도하는 객체기반의 오디오 장면을 제공하고, 사용자가 자신의 취향에 따라 오디오 장면을 변경할 수 있도록 하기 위한, 객체기반 오디오 전송/수신 시스템 및 그 방법을 제공하는데 그 목적이 있음. 3. 발명의 해결방법의 요지 본 발명은, 객체기반 오디오 전송 시스템에 있어서, 외부의 다양한 소스로부터 오디오신호를 입력받아 전처리 과정을 통해 객체 오디오신호를 생성하기 위한 전처리 수단; 상기 전처리 수단으로부터의 객체 오디오신호를 편집하여 오디오 장면을 구성하기 위한 객체기반 오디오 편집 수단; 상기 객체기반 오디오 편집 수단으로부터의 객체 오디오신호와 오디오 장면에 관한 정보를 부호화하고 다중화하여 객체기반 오디오 콘텐츠를 생성하기 위한 객체기반 오디오 부호화 수단; 및 상기 객체기반 오디오 부호화 수단으로부터의 객체기반 오디오 콘텐츠를 전송하기 위한 전송 수단을 포함함. 4. 발명의 중요한 용도 본 발명은 객체기반의 오디오 서비스 등에 이용됨. 객체기반 오디오, 오디오 장면구성, 오디오 장면합성, 사용자 제어
Abstract:
본 발명은 적어도 2개 이상의 신호가 다운믹스된 모노 신호로부터 분리되는 각각의 출력 채널의 빈 스펙트럼 밴드를 보상하기 위한 방법을 제공한다. 상기 방법은, 상기 각각의 출력 채널에 대하여, 이전 시간 영역에서의 상기 빈 스펙트럼 밴드의 상기 모노 신호에 대한 상기 출력 채널의 에너지비를 이용하여 상기 빈 스펙트럼 밴드의 현재 시간 영역에서의 에너지비를 추정하는 단계와, 상기 빈 스펙트럼 밴드의 앞 밴드의 상기 모노 신호에 대한 상기 출력 채널의 에너지비와 뒤 밴드의 상기 모노 신호에 대한 상기 출력 채널의 에너지비의 평균값을 이용하여 상기 빈 스펙트럼 밴드의 주파수 영역에서의 에너지비를 추정하는 단계와, 상기 추정된 현재 시간영역에서의 에너지비와 상기 주파수 영역에서의 에너지비를 이용하여 상기 빈 스펙트럼의 복원비를 결정하는 단계와, 상기 복원비를 상기 모노 신호값에 곱함으로써 상기 출력 채널의 빈 스펙트럼을 복원하는 단계를 포함한다. 바이노럴 큐 코딩(Binaural Cue Coding), 스펙트럼 복원
Abstract:
1. 청구범위에 기재된 발명이 속한 기술분야 본 발명은 객체기반의 오디오를 서비스하기 위한 객체기반 오디오 전송/수신 시스템 및 그 방법에 관한 것임. 2. 발명이 해결하려고 하는 기술적 과제 본 발명은 사용자에게 편집자가 의도하는 객체기반의 오디오 장면을 제공하고, 사용자가 자신의 취향에 따라 오디오 장면을 변경할 수 있도록 하기 위한, 객체기반 오디오 전송/수신 시스템 및 그 방법을 제공하는데 그 목적이 있음. 3. 발명의 해결방법의 요지 본 발명은, 객체기반 오디오 전송 시스템에 있어서, 외부의 다양한 소스로부터 오디오신호를 입력받아 전처리 과정을 통해 객체 오디오신호를 생성하기 위한 전처리 수단; 상기 전처리 수단으로부터의 객체 오디오신호를 편집하여 오디오 장면을 구성하기 위한 객체기반 오디오 편집 수단; 상기 객체기반 오디오 편집 수단으로부터의 객체 오디오신호와 오디오 장면에 관한 정보를 부호화하고 다중화하여 객체기반 오디오 콘텐츠를 생성하기 위한 객체기반 오디오 부호화 수단; 및 상기 객체기반 오디오 부호화 수단으로부터의 객체기반 오디오 콘텐츠를 전송하기 위한 전송 수단을 포함함. 4. 발명의 중요한 용도 본 발명은 객체기반의 오디오 서비스 등에 이용됨. 객체기반 오디오, 오디오 장면구성, 오디오 장면합성, 사용자 제어
Abstract:
본 발명은 다중 카메라 시스템에 관한 것으로, 다시점 비디오 스트림의 부호화/복호화 장치에서 자유로운 기본 설정 뷰를 처리할 수 있도록 하는 방법과 장치에 관한 것이다. 본 발명은 다시점 영상신호를 입력받아, 미리 설정되거나 사용자로부터 수신된 정보를 통해 설정된 기본설정 영상그룹 정보를 반영하여 인코딩하는 인코더; 미리 설정되거나 사용자로부터 수신된 정보를 통해 설정된 기본설정 영상그룹 정보를 상기 인코더로 제공하는 기본설정 영상그룹 선택부; 및 상기 인코딩된 영상신호를 다중화하고, 기본설정 영상그룹만을 순차적으로 출력하는 다중화부를 포함하는 다중 카메라 시스템의 부호화 장치를 개시한다. 기본 설정 뷰, 다중 비디오, 스테레오 영상 그룹, 인코딩, 디코딩