Abstract:
동적 모델 파라미터를 이용한 오디오 부호화 방법 및 오디오 복호화 방법, 오디오 부호화 장치 및 오디오 복호화 장치가 개시된다. 동적 모델 파라미터를 이용한 오디오 부호화 방법은 부호화 네트워크에서 오디오 신호의 차원을 축소할 때 레벨들 각각에 대응하는 동적 모델 파라미터를 이용할 수 있다. 그리고, 동적 모델 파라미터를 이용한 오디오 복호화 방법은 부호화 네트워크에서 오디오 신호의 차원을 확장할 때 레벨들 각각에 대응하는 동적 모델 파라미터를 이용할 수 있다.
Abstract:
다채널 오디오 신호의 바이노럴 렌더링 방법 및 장치가 개시된다. 바이노럴 렌더링 방법은 바이노럴 필터로부터 초기 반사음 성분과 잔향 성분을 추출하는 단계; 상기 초기 반사음 성분에 기초하여 다채널 오디오 신호를 바이노럴 렌더링함으로써 스테레오 오디오 신호를 생성하는 단계; 및 상기 잔향 성분을 상기 생성된 스테레오 신호에 적용하는 단계를 포함할 수 있다.
Abstract:
다채널 오디오 신호의 바이노럴 렌더링 방법 및 장치가 개시된다. 바이노럴 렌더링 방법은 바이노럴 필터로부터 초기 반사음 성분과 잔향 성분을 추출하는 단계; 상기 초기 반사음 성분에 기초하여 다채널 오디오 신호를 바이노럴 렌더링함으로써 스테레오 오디오 신호를 생성하는 단계; 및 상기 잔향 성분을 상기 생성된 스테레오 신호에 적용하는 단계를 포함할 수 있다.
Abstract:
다채널 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 신호 처리 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치가 개시된다. 디코딩 방법은 N채널의 입력 신호로부터 도출된 N/2 채널의 다운믹스 신호를 식별하는 단계; 복수의 OTT 박스들을 이용하여 상기 식별된 N/2 채널의 다운믹스 신호로부터 N채널의 출력 신호를 생성하는 단계를 포함할 수 있다. 상기 복수의 OTT 박스들의 개수는, 상기 출력 신호에 LFE 채널이 없는 경우 상기 다운믹스 신호의 채널수인 N/2와 동일할 수 있다.
Abstract:
천이구간 부호화 왜곡에 강인한 오디오 부호화/복호화 장치 및 방법이 개시된다. 오디오 부호화 방법은 입력 신호를 T/F(time-to-frequency) 변환하여 주파수 영역 신호를 출력하는 단계; 상기 주파수 영역 신호에 FDNS(frequency domain noise shaping) 부호화를 적용하여 상기 주파수 영역 신호에서 주파수축 포락선이 제거된 주파수 영역 잔차 신호를 출력하는 단계; 상기 주파수 영역 잔차 신호를 기초로 LPC(linear prediction coefficient) 분석을 수행하여 시간축 포락선이 제거된 시간 영역 잔차 신호를 출력하는 단계; 및 상기 시간 영역 잔차 신호를 양자화하여 전송하는 단계를 포함할 수 있다.
Abstract:
PURPOSE: An apparatus and a method for transcoding data between speech codecs having different CELP(Code Excited Linear Prediction) types are provided to reduce quantity of calculation and offer speech with high quality by utilizing one transcoding filter instead of a post-processing filter and a perception weighting filter. CONSTITUTION: A decoding process part(321) converts a bitstream with an input CELP codec format into a speech signal, wherein the bitstream is formed by coding an input speech signal. A transcoding filter(323) filters the decoded speech signal by filter characteristics calculated by adopting an optimal weighting value for minimum spectrum distortion. A transcoding filter design part(322) extracts the optimal weighting value from a weighting value set comprised of a plurality of weighting value pairs. A coding process part(324) codes the speech signal processed by the transcoding filter and thereby generates a bitstream of an output CELP codec format.
Abstract:
서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 장치 및 그 방법이 개시된다. 본 발명에 따른 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 장치는 서로 다른 포맷을 갖는 입력 CELP 코덱과 출력 CELP 코덱 사이에서, 입력 CELP 코덱의 포맷을 출력 CELP 코덱의 포맷으로 변환하는 본 발명에 따른 상호부호화 장치는 입력 CELP 코덱 포맷으로 부호화된 비트스트림를 음성 신호로 변환하는 입력 CELP 코덱의 복호화 처리부, 기준필터를 기준으로, 스펙트럼 왜곡이 최소가 되는 최적의 가중치를 적용하여 계산되는 필터 특성으로 입력 CELP 코덱의 복호화 처리부에서 복호화된 음성신호를 필터 처리하는 상호부호화 필터, 다수의 가중치로 이루어진 가중치 세트로부터 상호부호화 필터의 스펙트럼 왜곡을 최소화하는 최적의 가중치를 추출하여 상호부호화 필터로 제공하는 상호부호화 필터 설계부 및 상호부호화 필터에서 필터 처리된 음성신호를 부호화하여 출력 CELP 코덱 포맷의 비트스트림를 생성하는 출력 CELP 코덱의 부호화 처리부를 포함하는 것을 특징으로 하고, 하나의 상호부호화 필터를 이용하여 종래의 후-필터 및 지각가중필터를 대신함으로써, 상호부호화기의 연산량을 감소시키면서도 수신단에서 복호화된 음성의 음질을 향상시킬 수 있다.
Abstract:
상호부호화기에서 개회로 피치 추정 방법 및 그 장치가 개시된다. 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화를 위한 상호부호화기에서 본 발명에 따른 개회로 피치 추정 방법은, 입력 CELP 코덱 포맷으로 부호화된 비트스트림를 음성 신호로 복호화하고, 복호화된 음성신호의 각 부-프레임에 대한 폐-루프 피치를 추출하는 (a)단계, 복호화된 음성 신호를 사람의 청각기관 특성을 고려한 지각가중필터 처리를 하는 (b)단계, 복호화된 폐-루프 피치와, 이전 프레임의 마지막 부-프레임에 대한 폐-루프 피치 또는 동일 프레임에 대한 이전 개-루프 피치를 이용하여 결정된 개-루프 피치 검색 범위에서 지각가중필터링된 음성신호의 개-루프 피치를 검색하는 (c)단계 및 검색된 개-루프 피치를 이용하여 결정된 폐-루프 피치 검색 범위에서 지각가중 필터링된 음성신호의 폐-루프 피치를 검색하고, 검색된 결과를 출력 CELP 코덱 포맷의 피치 지연값으로서 생성하는 (d)단계를 포함하는 것을 특징으로 하며, 기존 재-검색 방식보다 음질 저하를 줄일 수 있으며, 계산량 감소 효과를 얻을 수 있다.