Abstract:
PURPOSE: A method and system for separating a music sound source without using a sound source database are provided to separate a sound source generated using a rhythm musical instrument based on characteristics of the rhythm musical instrument repeated in an aspect of time, and thereby may separate a sound source included in a mixed signal even when a learning database generated using a specific sound source is absent. CONSTITUTION: An NMPCF(Nonnegative Matrix Partial Co-Factorization) analysis unit(130) obtains info nation shared by the plurality of segments in accordance with an NMPCF algorithm. A rhythm instrument signal has frequency characteristics such as a pitch, that may not be easily changed, and may be repeatedly generated, whereby the shared information may correspond to information of a rhythm musical instrument. A target instrument signal separating unit(140) separates a target instrument signal corresponding to a specific sound source from the mixed signal by calculating an inner product between the entity matrices obtained by the NMPCF analysis unit. The target instrument signal is a signal including sounds generated using the rhythm musical instrument. A signal association unit(150) associates the target instrument signals for each of the plurality of segments separated in the target instrument signal separating unit.
Abstract:
PURPOSE: An apparatus and a method for structuring bitstream for an object-based audio service are provided to reduce a degradation in the sound quality occurring due to an excessive volume control by designating an upper bound value and a lower bound value of a reproduction volume in an object-based audio service. CONSTITUTION: A bitstream splitting unit divides a bitstream into a file header, and an audio object frame through sound source splitting(110). A reproduction level information storage unit stores the reconstruction level information for the regeneration of the audio object within the file header(120). A preset storage unit stores the preset information for the regeneration of the audio object within the file header(130).
Abstract:
본 발명은 오디오 생성 및 소비 방법과 그 장치 및 컴퓨터로 읽을 수 있는 기록매체와 파일 구조에 관한 것으로서, 더욱 상세하게는 오디오 프리셋 생성 및 소비 방법과 그 장치 및 컴퓨터로 읽을 수 있는 기록매체와 파일 구조에 관한 것이다. 본 발명에 따른 오디오 프리셋 생성 방법은 복수의 오디오 객체들에 대한 오디오 장면을 정의하기 위한 프리셋 구성의 환경을 제공하는 단계, 프레셋 구성에 따라 복수의 오디오 객체들을 믹싱하여 복수의 오디오 프리셋을 생성하는 단계 및 생성된 복수의 오디오 프리셋에 대한 구성 정보를 생성하는 단계를 포함한다. 객체기반 오디오 서비스, 프리셋, 오디오 장면
Abstract:
PURPOSE: An apparatus and a method for converting an audio signal are provided to change the depth of a sound source signal or channel signal while not increasing the quality of an audio signal. CONSTITUTION: A signal extraction unit(110) extracts a sub signal from an audio signal including plural sub signals, and a control unit(120) changes a virtual position in a reproduction space of the audio signal corresponding to the extracted sub signal. A renderer(130) renders the sub signal of which virtual position is changed and a non-extracted sub signal. The sub signal is a sound source signal or a channel signal.
Abstract:
본 발명은 공간큐 기반의 바이노럴 스테레오 합성 장치 및 그 방법과, 그를 이용한 바이노럴 스테레오 복호화 장치에 관한 것으로, 공간큐 정보(가상음원 위치정보)와 각 채널별 바이노럴 필터 계수에 기초하여 좌/우 오디오 신호를 주파수 영역에서 필터링하고, 그 필터링된 신호를 바이노럴 스테레오 신호로 복호화함으로써, 주파수 영역에서의 선형 복적분을 통해 고품질의 바이노럴 스테레오 신호를 용이하게 재생할 수 있게 하는, 공간큐 기반의 바이노럴 스테레오 합성 장치 및 그 방법과, 그를 이용한 바이노럴 스테레오 복호화 장치를 제공하고자 한다. 이를 위하여, 본 발명은, 공간큐 기반의 바이노럴 스테레오 합성 장치에 있어서, 가상음원 위치 기반의 공간큐 정보를 합성하여 서브밴드별 각 채널의 파워 이득값을 산출하기 위한 공간큐 정보 합성 수단; 상기 산출된 각 채널의 파워 이득값과 바이노럴 필터 계수에 기초하여, 좌/우 오디오 신호를 주파수 영역에서 필터링하기 위한 신호 필터링 수단; 및 상기 필터링된 신호를 시간 영역으로 역변환하기 위한 신호 역변환 수단을 포함한다. 공간큐 정보, 가상음원 위치정보, 바이노럴 필터 계수, 바이노럴 스테레오 합성, 바이노럴 스테레오 복호화, 공간큐 기반의 오디오 코딩, 3차원 오디오
Abstract:
PURPOSE: A unified speech/audio coder(USAC) processing windows sequence based mode switching is provided to perform encoding or decoding by processing different window sequences for different situation, thereby improving coding efficiency. CONSTITUTION: A mode switching unit performs inter-linear prediction domain mode switching for the sub-frames which constitute a frame of an input signal. An encoding unit applies a window sequence to current encoding subframes, wherein the window sequence is based on a switched LPD(Linear Prediction Domain) mode. In addition, the encoding unit applies a changed window sequence to the current encoding subframe according to the LPD modes of previous and following subframes.
Abstract:
본 발명은 인간이 음원의 변위를 인지하는 임계치를 이용하여 멀티채널 오디오 신호를 채널별로 제어하여 사용자에게 역동적인 멀티채널 오디오 서비스를 제공하는 것을 목적으로 한다. 본 발명에 의한 멀티채널 오디오 신호를 전송하는 장치는 멀티채널 오디오 신호를 부호화하여 멀티채널 오디오 스트림을 생성하는 멀티채널 오디오 부호화기와, 멀티채널 오디오 신호의 장면을 표현하는 멀티채널 오디오 제어정보를 부호화하여 장면표현언어 스트림을 생성하는 장면표현언어 부호화기와, 상기 멀티채널 오디오 스트림과 상기 장면표현언어 스트림을 다중화하는 다중화기를 포함하고, 상기 멀티채널 오디오 제어정보는 상기 멀티채널 오디오 신호를 구성하는 각 채널 신호를 개별적으로 제어하는 데이터를 포함하고, 상기 채널 신호를 개별적으로 제어하는 데이터는 채널 수, 각 채널 신호의 수평 위치, 각 채널 신호의 수직 위치, 각 채널 신호의 수평방향 변이속도, 각 채널 신호의 수직방향 변이속도 중 적어도 하나를 포함한다.
Abstract:
본 발명은 음장 합성을 이용한 입체 음장 재생 장치 및 그 방법에 관한 것으로, 협소 공간(예 : 차량 공간 등)에 설치된 라우드스피커 어레이를 통해 다채널 오디오 신호를 재생할 때, 특히 음장 합성(WFS: Wave Field Synthesis) 렌더링을 이용하여 다채널 오디오 신호를 협소 공간 밖의 가상의 음상에 정위시켜 입체 음장 재생을 함으로써, 사용자에게 위치(예 : 차량 승차 위치 등)에 관계없이 일정한 음상을 제공할 수 있으며 한정된 공간에서도 넓은 청취 공간을 제공할 수 있게 하는, 음장 합성을 이용한 입체 음장 재생 장치 및 그 방법을 제공하고자 한다. 이를 위하여, 본 발명은, 입체 음장 재생 장치에 있어서, 입력받은 다채널 오디오 신호를 분석하여 오디오 신호의 채널 수를 확인하고 상기 다채널 오디오 신호로부터 상기 확인된 채널별 음원 신호를 추출하기 위한 오디오 신호 분석 수단; 상기 확인된 오디오 신호의 채널 수에 맞게, 상기 추출된 채널별 음원 신호를 음장 합성 방식으로 협소 공간 외부의 가상 음상에 정위시키기 위한 음장 합성 렌더링 수단; 및 상기 정위된 가상 음원 신호를 재생하기 위한 오디오 재생 수단을 포함한다. 다채널 라우드스피커, 라우드스피커 어레이, 음잡 합성, 입체 음장 재생, 협소 공간, 음장 합성 렌더링, 가상의 음상
Abstract:
PURPOSE: An apparatus and a method for encoding and decoding an integrated voice and music signal are provided to effectively select internal modules according to a characteristic of an input signal, thereby providing excellent sound quality to both a voice signal and a music signal at various bit rates. CONSTITUTION: An input signal analysis unit(110) analyzes a characteristic of an input signal. When the input signal is a music characteristic signal, the first conversion encoding unit(120) converts the input signal into a frequency domain to encode. When the input signal is a voice characteristic signal, an LPC(Linear Predictive Coding) encoder encodes the input signal based on LPC. A bit stream generator(140) uses output signals of the first conversion encoding unit and the LPC encoder to generate a bit stream.
Abstract:
PURPOSE: An apparatus for determining a signal state of an audio signal is provided to suitably select a voice encoder based on LPC(Linear Predictive Coding) and an audio encoder based on conversion according to a characteristic of an input signal. CONSTITUTION: A signal state observer(101) classifies characteristics of an input signal to output each state observation probability. A state chain unit(102) outputs a state identifier of a frame of the input signal based on the state observation probability. An encoder encoding a frame of the input signal is determined according to the state identifier. The signal state observer comprises a characteristic extracting unit, an entropy base determining tree and a silence state determining unit.