Abstract:
PURPOSE: An apparatus and a method for structuring bitstream for an object-based audio service are provided to reduce a degradation in the sound quality occurring due to an excessive volume control by designating an upper bound value and a lower bound value of a reproduction volume in an object-based audio service. CONSTITUTION: A bitstream splitting unit divides a bitstream into a file header, and an audio object frame through sound source splitting(110). A reproduction level information storage unit stores the reconstruction level information for the regeneration of the audio object within the file header(120). A preset storage unit stores the preset information for the regeneration of the audio object within the file header(130).
Abstract:
PURPOSE: A system for separating musical sound source is provided to efficiently divide a specific sound source in a mixed sound source by reorganizing the mixed sound source into the specific sound source and other sound source. CONSTITUTION: A system for separating musical sound source includes a database(110), a time-frequency domain conversion unit(120), an NMPCF(Nonnegative Matrix Partial Co-Factorization) analysis unit(130), a target instrument signal separating unit(140), and a time domain signal conversion unit(150). The database stores information about a solo performance using a predetermined musical instrument, and transmits the information about the solo performance as a type of a predetermined sound source signal(x1). The predetermined sound source has a significantly great amount of data to include various characteristics of the predetermined sound source. In this case, a great amount of database signals may need to be processed for each sound source separation operation.
Abstract:
PURPOSE: An apparatus and a method for converting an audio signal are provided to change the depth of a sound source signal or channel signal while not increasing the quality of an audio signal. CONSTITUTION: A signal extraction unit(110) extracts a sub signal from an audio signal including plural sub signals, and a control unit(120) changes a virtual position in a reproduction space of the audio signal corresponding to the extracted sub signal. A renderer(130) renders the sub signal of which virtual position is changed and a non-extracted sub signal. The sub signal is a sound source signal or a channel signal.
Abstract:
PURPOSE: The apparatus for the inter-object regeneration relation and volume information storage and interpretive method and this easily can easily force and restriction of the object-based audio service by advance defining the force/constraint condition about the regeneration relation of inter-object and replay volume. CONSTITUTION: The object-based audio player(101) inputs the audio object information and the force/condition information included within the object-based audio file(102) to the force/condition information Analysis module. Object the audio track or the group. The combination generation consisting of the group is the audio track or group. The force/condition information Analysis module(103) interprets and the magnetic track decoded before the decryption algorithm of the audio object is or reject adopted.
Abstract:
PURPOSE: An apparatus and a method for separating an audio channel are provided to sort sound sources of a specific direction by spatially filtering a stereo audio signal through a cross correlation value between a channel and a sound source position detected from the stereo audio signal. CONSTITUTION: A sub band analyzing part(820) analyzes a stereo audio signal, and sorts the signal into a sub band unit. A channel power calculating part(830) calculates a power of a channel signal according to a sub band from the stereo audio signal sorted into the sub band unit. A sound source position detecting part(840) detects a sound source position through the power of the channel signal according to the sub band. A cross correlation calculating part(850) calculates a cross correlation between the channels from the stereo audio signal sorted into the sub band unit. A channel signal separating part(860) sorts the stereo audio signal into each channel signal through spatial filtering using the cross correlation value between the channel and the sound source position.
Abstract:
1. 청구범위에 기재된 발명이 속한 기술분야 본 발명은 변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화 장치 및 그 방법에 관한 것임. 2. 발명이 해결하려고 하는 기술적 과제 본 발명은 입력된 오디오 신호를 선형예측 부호화해서 구한 오차 신호를 그 오차 신호의 마스킹 임계치(이하, 오차 마스킹 임계치)를 이용하여 부호화하고, 부호화된 비트열을 복호화해서 구한 오차 신호를 선형예측 부호화정보(선형 예측 분석 계수)를 이용하여 선형예측 복호화함으로써, 오디오 부호화의 압축 효율을 향상시킬 수 있게 하는, 변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화 장치 및 그 방법을 제공하는데 그 목적이 있음. 3. 발명의 해결방법의 요지 본 발명은, 변형 선형예측 부호화를 이용한 오디오 부호화 장치에 있어서, 외부로부터 입력된 오디오 신호(원신호)를 시간 영역에서 선형예측 부호화하여 오차 신호를 구하기 위한 오차 신호 계산 수단; 상기 오차 신호 계산 수단에서 구한 오차 신호를 주파수 영역 신호로 변환하기 위한 주파수 영역 변환 수단; 상기 원신호와 상기 원신호의 선형예측 부호화에 사용된 부호화 정보를 이용해서, 상기 오차 신호의 부호화에 사용되는 마스킹 임계치를 구하기 위한 마스킹 임계치 계산 수단; 및 상기 주파수 영역 변환 수단에서 변환된 오차 신호를 상기 구한 마스킹 임계치 를 이용하여 지각적 부호화하기 위한 지각적 부호화 수단을 포함함. 4. 발명의 중요한 용도 본 발명은 변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화 등에 이용됨. 변형 선형예측 부호화(WLPC), 고급 오디오 부호화(AAC), 심리음향 모델(PAM), 오디오 압축, 지각적 부호화, 마스킹 임계치
Abstract:
오디오 신호의 무손실 부호화/복호화 장치 및 그 방법이 개시된다. 오디오 신호의 무손실 부호화 장치는 제1 심볼을 직접 부호화하는 제1 부호화기, 제1 심볼을 제2 심볼로 변환하고, 제2 심볼을 부호화하는 복수의 제2 부호화기를 포함하는 제2 부호화기 모듈, 제1 부호화기와 복수의 제2 부호화기의 성능을 비교하고, 비교 결과에 따라서 부호화 모드를 출력하는 제1 선택기, 및 부호화 모드에 대응하여 제1 심볼을 부호화하여 출력하는 제2 선택기로 이루어진다. 이에 따르면, 오디오 신호의 부호화 성능을 향상시킬 수 있다.
Abstract:
1. 청구범위에 기재된 발명이 속한 기술분야 본 발명은 객체기반 오디오 서비스를 위한 다중객체 오디오 콘텐츠 파일의 생성, 편집 및 재생 방법과, 오디오 프리셋 생성 방법에 관한 것임. 2. 발명이 해결하려고 하는 기술적 과제 본 발명은 객체기반 오디오 서비스의 기능을 증대시키고 오디오 콘텐츠 파일의 각 객체로의 접근 용이성을 증가시키기 위한, 객체기반 오디오 서비스를 위한 다중객체 오디오 콘텐츠 파일의 생성, 편집 및 재생 방법과, 오디오 프리셋 생성 방법을 제공하는데 그 목적이 있음. 3. 발명의 해결방법의 요지 본 발명은, 객체기반 오디오 서비스를 위한 다중객체 오디오 콘텐츠 파일 생성 방법에 있어서, 오디오 콘텐츠를 구성하는 각각의 객체에 대하여 복수의 프레임을 생성하는 프레임화 단계; 및 상기 생성된 프레임들을 객체 유형에 관계없이 재생시각을 기준으로 그룹화하여 저장함으로써 다중객체 오디오 콘텐츠 파일을 생성하는 콘텐츠파일 생성 단계를 포함함. 4. 발명의 중요한 용도 본 발명은 객체기반 오디오 서비스 등에 이용됨. 객체기반 오디오, 오디오 객체, 다중객체 오디오 콘텐츠 파일, 프리셋, 색인 정보
Abstract:
An apparatus and a method for multi-stage conversion are provided to use multi-dimension conversion or multi-stage conversion to raise the compression efficiency of energy and improve the coding performance. Input image data are DCT(Discrete Cosine Transform)-converted, and R blocks are selected from the DCT-converted image data. In selected R blocks, transform coefficients of the same frequency are one-dimensionally arranged. The one-dimensionally arranged transform coefficients are one-dimensionally converted. The R blocks are selected from the DCT-converted image data in a horizontal direction, a vertical direction, or a diagonal direction.
Abstract:
본 발명은 반원 평면상의 가상음원정보(VSLI:Virtual Source Location Information)를 이용한 멀티채널 신호의 압축 및 복원 방법에 관한 것으로, 공간 큐(spatial cue) 정보로서 채널간 에너지 비(Inter Channel Level Difference: ICLD) 대신 VSLI를 이용함으로써 공간 큐 정보의 양자화에 의한 손실을 최소화하여 복원된 오디오 신호의 음질을 향상시킬 수 있으며, 복호기에서 원 신호 복원 시 스펙트럼 왜곡을 감쇄시켜 보다 양질의 오디오 신호를 재생할 수 있는 효과가 있다. 바이노럴 큐 코딩(BCC: Binaural Cue Coding), 가상음원위치정보(VSLI: Virtual Source Location Information), 멀티채널 오디오