Abstract:
PURPOSE: An apparatus and a method for separating an audio channel are provided to sort sound sources of a specific direction by spatially filtering a stereo audio signal through a cross correlation value between a channel and a sound source position detected from the stereo audio signal. CONSTITUTION: A sub band analyzing part(820) analyzes a stereo audio signal, and sorts the signal into a sub band unit. A channel power calculating part(830) calculates a power of a channel signal according to a sub band from the stereo audio signal sorted into the sub band unit. A sound source position detecting part(840) detects a sound source position through the power of the channel signal according to the sub band. A cross correlation calculating part(850) calculates a cross correlation between the channels from the stereo audio signal sorted into the sub band unit. A channel signal separating part(860) sorts the stereo audio signal into each channel signal through spatial filtering using the cross correlation value between the channel and the sound source position.
Abstract:
본 발명은 상호상관을 이용한 다채널 오디오 신호 복호화 장치 및 그 방법에 관한 것으로, 좌우 채널 간 상호상관 값을 이용하여 다운믹싱 스테레오 오디오 신호로부터 다채널 오디오 신호를 생성하고 부호화 정보(상호상관 정보, 가상음원 방향정보)를 이용하여 상기 생성된 다채널 오디오 신호를 조정함으로써, 다채널 오디오 신호 중 중앙채널 및 서라운드 채널 신호를 정확하게 복원하기 위한, 상호상관을 이용한 다채널 오디오 신호 복호화 장치 및 그 방법을 제공하고자 한다. 이를 위하여, 본 발명은 상호상관을 이용한 다채널 오디오 신호 복호화 장치에 있어서, 좌/우 채널 간 상호상관 값을 이용하여 다운믹싱 스테레오 오디오 신호로부터 복수의 채널별 오디오 신호를 생성하기 위한 다채널 신호 생성 수단; 및 상기 다운믹싱 스테레오 오디오 신호에 대한 원 신호를 복원할 수 있도록, 상기 생성된 복수의 채널별 오디오 신호의 상호상관 값 및 서브밴드별 파워 값을 상기 원 신호의 채널 간 상호상관 정보와 가상음원 방향정보를 이용하여 조정하기 위한 다채널 신호 조정 수단을 포함한다. 다운믹싱 스테레오 오디오 신호, 다채널 오디오 신호, 서라운드 좌채널 오디오 신호, 서라운드 우채널 오디오 신호, 상호상관, 가상음원 방향정보
Abstract:
An apparatus and a method for transmitting/receiving an interactive audio are provided to activate an interactive audio service by providing a common general-purpose interactive audio service. An interactive audio transmitting device(310) transmits a mixing sound source to an interactive audio receiving device(320) by down-mixing an object sound source. The interactive audio transmitting device transmits decoding information and scene information for decoding the object sound source to the interactive audio receiving device. The interactive audio receiving device receives the scene information and the decoding information of the object sound source and the mixing sound source down-mixed from the interactive audio transmitting device. The interactive audio receiving device decodes the object sound source by using the decoding information of the object sound source and the mixing sound source. A decoded object sound source comprises a sound source signal or a track signal. The interactive audio receiving device synthesizes interactive audio contents by using the decoded object sound source and the scene information.
Abstract:
1. 청구범위에 기재된 발명이 속한 기술분야 본 발명은 변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화 장치 및 그 방법에 관한 것임. 2. 발명이 해결하려고 하는 기술적 과제 본 발명은 입력된 오디오 신호를 선형예측 부호화해서 구한 오차 신호를 그 오차 신호의 마스킹 임계치(이하, 오차 마스킹 임계치)를 이용하여 부호화하고, 부호화된 비트열을 복호화해서 구한 오차 신호를 선형예측 부호화정보(선형 예측 분석 계수)를 이용하여 선형예측 복호화함으로써, 오디오 부호화의 압축 효율을 향상시킬 수 있게 하는, 변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화 장치 및 그 방법을 제공하는데 그 목적이 있음. 3. 발명의 해결방법의 요지 본 발명은, 변형 선형예측 부호화를 이용한 오디오 부호화 장치에 있어서, 외부로부터 입력된 오디오 신호(원신호)를 시간 영역에서 선형예측 부호화하여 오차 신호를 구하기 위한 오차 신호 계산 수단; 상기 오차 신호 계산 수단에서 구한 오차 신호를 주파수 영역 신호로 변환하기 위한 주파수 영역 변환 수단; 상기 원신호와 상기 원신호의 선형예측 부호화에 사용된 부호화 정보를 이용해서, 상기 오차 신호의 부호화에 사용되는 마스킹 임계치를 구하기 위한 마스킹 임계치 계산 수단; 및 상기 주파수 영역 변환 수단에서 변환된 오차 신호를 상기 구한 마스킹 임계치 를 이용하여 지각적 부호화하기 위한 지각적 부호화 수단을 포함함. 4. 발명의 중요한 용도 본 발명은 변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화 등에 이용됨. 변형 선형예측 부호화(WLPC), 고급 오디오 부호화(AAC), 심리음향 모델(PAM), 오디오 압축, 지각적 부호화, 마스킹 임계치
Abstract:
오디오 신호의 무손실 부호화/복호화 장치 및 그 방법이 개시된다. 오디오 신호의 무손실 부호화 장치는 제1 심볼을 직접 부호화하는 제1 부호화기, 제1 심볼을 제2 심볼로 변환하고, 제2 심볼을 부호화하는 복수의 제2 부호화기를 포함하는 제2 부호화기 모듈, 제1 부호화기와 복수의 제2 부호화기의 성능을 비교하고, 비교 결과에 따라서 부호화 모드를 출력하는 제1 선택기, 및 부호화 모드에 대응하여 제1 심볼을 부호화하여 출력하는 제2 선택기로 이루어진다. 이에 따르면, 오디오 신호의 부호화 성능을 향상시킬 수 있다.
Abstract:
1. 청구범위에 기재된 발명이 속한 기술분야 본 발명은 객체기반 오디오 서비스를 위한 다중객체 오디오 콘텐츠 파일의 생성, 편집 및 재생 방법과, 오디오 프리셋 생성 방법에 관한 것임. 2. 발명이 해결하려고 하는 기술적 과제 본 발명은 객체기반 오디오 서비스의 기능을 증대시키고 오디오 콘텐츠 파일의 각 객체로의 접근 용이성을 증가시키기 위한, 객체기반 오디오 서비스를 위한 다중객체 오디오 콘텐츠 파일의 생성, 편집 및 재생 방법과, 오디오 프리셋 생성 방법을 제공하는데 그 목적이 있음. 3. 발명의 해결방법의 요지 본 발명은, 객체기반 오디오 서비스를 위한 다중객체 오디오 콘텐츠 파일 생성 방법에 있어서, 오디오 콘텐츠를 구성하는 각각의 객체에 대하여 복수의 프레임을 생성하는 프레임화 단계; 및 상기 생성된 프레임들을 객체 유형에 관계없이 재생시각을 기준으로 그룹화하여 저장함으로써 다중객체 오디오 콘텐츠 파일을 생성하는 콘텐츠파일 생성 단계를 포함함. 4. 발명의 중요한 용도 본 발명은 객체기반 오디오 서비스 등에 이용됨. 객체기반 오디오, 오디오 객체, 다중객체 오디오 콘텐츠 파일, 프리셋, 색인 정보
Abstract:
An apparatus and a method for multi-stage conversion are provided to use multi-dimension conversion or multi-stage conversion to raise the compression efficiency of energy and improve the coding performance. Input image data are DCT(Discrete Cosine Transform)-converted, and R blocks are selected from the DCT-converted image data. In selected R blocks, transform coefficients of the same frequency are one-dimensionally arranged. The one-dimensionally arranged transform coefficients are one-dimensionally converted. The R blocks are selected from the DCT-converted image data in a horizontal direction, a vertical direction, or a diagonal direction.
Abstract:
An apparatus and a method for visualizing a multi-channel audio signal are provided to offer a more realistic multi-channel audio service to a user by visually expressing a dynamic volume sense and a dynamic sound field sense of the multi-channel audio signal. A spatial audio decoding unit(110) receives a down-mix signal of a time domain, converts the received down-mix signal into a signal of a frequency domain, and outputs the frequency domain down-mix signal. The spatial audio decoding unit(110) synthesizes a multi-channel audio signal by using the spatial parameter and the down-mix signal. A multi-channel visualizing unit(130) generates visualization information of the multi-channel audio signal by using the frequency domain down-mix signal and the spatial parameter.
Abstract:
1. 청구범위에 기재된 발명이 속하는 기술 분야 본 발명은 잔향 처리를 위한 음향 장면 생성 및 소비 방법에 관한 것임. 2. 발명이 해결하려고 하는 기술적 과제 본 발명은 "AcousticScene" 노드의 구조를 확장함으로써 잔향 파라미터를 이용하여 잔향음을 생성하는 방법, 디지털 인공잔향 필터(digital artificial reverberation filter)를 이용하는 방법 및 실내응답신호(room impulse response signal)를 직접 참조하는 방법 중 단말에 가장 적절한 방법을 선택하여 잔향음을 생성하도록 하는 잔향 처리를 위한 음향 장면 생성 및 소비 방법을 제공하고자 함. 3. 발명의 해결 방법의 요지 본 발명은, 잔향 처리를 위한 음향 장면 생성 방법에 있어서, 음향 객체를 생성하는 단계; 및 실내응답신호를 이용하여 상기 음향 객체에 잔향 처리를 하기 위한 잔향 특성 정보를 포함한 음향 장면 기술 정보를 생성하는 단계를 포함하되, 상기 잔향 특성 정보는, 잔향 파라미터, 잔향 필터 및 실내응답신호 중 어느 것을 이용하여 잔향음을 생성하는지에 대한 정보를 기술하는 구성 정보를 포함함. 4. 발명의 중요한 용도 본 발명은 MPEG-4 단말 등에 이용됨. 잔향음, MPEG-4, 초기반사, 후기잔향, 디지털 인공 잔향 필터, 실내 응답 신호(room impulse response)
Abstract:
1. 청구범위에 기재된 발명이 속한 기술분야 본 발명은 3차원 오디오 재생 휴대용 단말기에 관한 것임. 2. 발명이 해결하고자 하는 기술적 과제 본 발명은 스피커를 대각 방향으로 배치함으로써, 휴대용 단말기의 회전에 무관하게 하나의 역필터 매트릭스를 이용하여 크로스 토크를 제거하여 3차원 입체 음향을 구현할 수 있는 3차원 오디오 재생 휴대용 단말기를 제공하는데 그 목적이 있음. 3. 본 발명의 해결방법의 요지 본 발명은 3차원 오디오 신호를 재생하는 휴대용 단말기에 있어서, 상기 휴대용 단말기의 회전에 무관한 하나의 역필터 매트릭스를 이용하여, 스피커 수단으로 출력될 오디오 신호의 크로스 토크(cross-talk)를 제거하기 위한 오디오신호 처리 수단; 상기 크로스 토크가 제거된 오디오 신호를 재생하기 위한 오디오 신호 재생 수단; 및 상기 오디오 신호 재생 수단으로부터 입력되는 오디오 신호를 증폭하여 출력하는 좌, 우 2개의 스피커를 구비하되, 상기 2개의 스피커가 대각방향으로 배치된 상기 스피커 수단을 포함함. 4. 발명의 중요한 용도 본 발명은 휴대용 단말기 등에 이용될 수 있음. 스피커, 크로스 토크, 역필터 매트릭스