Abstract:
다채널 오디오 신호의 바이노럴 렌더링 방법 및 장치가 개시된다. 바이노럴 렌더링 방법은 바이노럴 필터로부터 초기 반사음 성분과 잔향 성분을 추출하는 단계; 상기 초기 반사음 성분에 기초하여 다채널 오디오 신호를 바이노럴 렌더링함으로써 스테레오 오디오 신호를 생성하는 단계; 및 상기 잔향 성분을 상기 생성된 스테레오 신호에 적용하는 단계를 포함할 수 있다.
Abstract:
PURPOSE: A signal codec device in a communication system and a method thereof are provided to minimize an quantization error about frequency coefficients by quantizing the frequency coefficients of voice and audio signals converted into a frequency area through MDCT(Modified Discrete Cosine Transform). CONSTITUTION: A converter(102) calculates frequency coefficients of voice and audio signals. A band divider(112) divides the frequency coefficients by sub band and calculates sub band coefficients from the frequency coefficients. Sub band coefficient quantization units(114-118) calculate sub band quantization indexes by quantizing the sub band coefficients according to features of each sub bands. [Reference numerals] (102) Converter; (104) Linear prediction coefficient calculator; (106) Linear prediction coefficient quantization unit; (108) Linear prediction coefficient dequantization unit; (110) Linear prediction analysis filter; (112) Band divider; (114) First sub band coefficient quantization unit; (116) Second sub band coefficient quantization unit; (118) N-th sub band coefficient quantization unit; (120) Multiplexer
Abstract:
본 발명은 MDCT 계수의 크기에 따라 그 크기를 조절하여 음질을 향상시키는 MDCT 영역에 대한 후처리 방법에 대한 것이다. 본 발명에 따른 MDCT 영역에 대한 후처리 방법은, 입력 프레임의 MDCT 계수에 대한 미분값의 증감을 토대로 MDCT 계수에 의한 피크(peak)와 밸리(valley)를 구하고, 피크와 밸리를 단위로 하는 복수의 서브 대역을 형성하는 단계, 복수의 피크에 대한 미분값의 증감을 토대로 복수의 피크에 대한 글로벌 포먼트와 밸리를 판단하고, 글로벌 포먼트와 밸리에 대한 서브 대역을 통합하여 복수의 대역을 형성하는 단계, 입력신호에 대한 shaping 비율을 대역에 적용하여 각 대역에 대한 필터 계수를 구하는 단계, 및 MDCT 계수에 필터 계수를 승산하여 각 대역의 입출력 MDCT 계수의 이득을 일치시키는 단계를 구비한다. MDCT, 코덱, 글로벌 포먼트, 밸리, shaping 비율
Abstract:
본 발명은 MDCT 영역에서 동작하는 후처리 필터장치 및 필터방법에 관한 것으로, 더욱 상세하게는 과거와 현재의 MDCT 계수를 이용하여 실제 음성 스펙트럼과 유사한 스펙트럼 계수를 얻고 그 계수 크기가 작은 곳에서는 미분값이 크도록, 계수 크기가 큰 곳에서는 미분값이 작도록 볼록 함수로 변환하여 후처리 필터 계수를 구하고 이를 MDCT 계수에 적용하여 음성 신호 왜곡 없이 코딩 잡음을 줄이는 후처리 필터장치 및 필터방법에 관한 것이다. 이에 의하면, 현재와 과거의 MDCT 값을 모두 사용하기 때문에 실제 음성 스펙트럼과 유사한 계수를 획득하는 것이 가능하고 더 정확한 필터 계수를 얻을 수 있다. 또한, 볼록 함수에 의해 계수를 적절히 변환하였기 때문에 음질을 향상시킬 수 있다. 후처리 필터(post-filter), 코덱(codec), MDCT(modified discrete cosine transform), 볼록 함수, 음성 스펙트럼
Abstract:
A post-processing filter apparatus for improving sound quality in an MDCT(Modified Discrete Cosine Transform) area and a filter method are provided to use MDCT functions of both previous frame and current frame, thereby obtaining more similar coefficients to substantial voice spectrum. A spectrum coefficient generator(101) generates spectrum coefficients by using MDCT coefficients of the current voice frame and a previous voice frame. A normalizing unit(102) normalizes the generated spectrum coefficients. A transforming unit(103) maps the normalized spectrum coefficients with convex functions to generate converted spectrum coefficients. A filter coefficient generator(104) generates filter coefficients by controlling reflecting degrees of the converted spectrum coefficients. An MDCT coefficient generator(105) generates new MDCT coefficients by multiplying the filter coefficients by the MDCT coefficients of the current voice frame.
Abstract:
An Improved layer encoding/decoding apparatus is provided to reduce a quantization error of G.711 codec by allocating addition mantissa information to each sample. Characteristic indexes of addition mantissa information of each sample are calculated based on characteristic information of each sample of a frame(S510). A process of each one bit allocation to samples including current characteristic index is repeatedly performed until the total number of bits allocated to the samples is consistent with the total number of bits available in the frame(S520). Whenever repeatedly performing the above process, the current characteristic index is set to be smaller from the maximum value as much as one. Most significant bits corresponding to the number of bits allocated to each sample among bits of the addition mantissa information of each sample of the frame are outputted.
Abstract:
1. 청구범위에 기재된 발명이 속한 기술분야 본 발명은 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템에 관한 것임. 2. 발명이 해결하려고 하는 기술적 과제 본 발명은, 대역-분할 방식의 광대역 코덱에서 고대역에 대한 패킷 분실 및 프레임 오류를 효과적으로 은닉함으로써, 고품질의 음성 통화를 가능하게 하기 위한 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템을 제공하고자 함. 3. 발명의 해결방법의 요지 본 발명은, 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치에 있어서, 고대역 오류 검출에 따라, 외부의 저대역 복호화부로부터 전달받은 저대역 합성 음성에 대해서 LPC(Linear Predictive Coding) 분석을 통해 저대역 LPC 계수를 추출하기 위한 저대역 LPC 계수 추출수단; 상기 저대역 복호화부로부터 전달받은 저대역 합성 음성과 상기 저대역 LPC 계수 추출수단에서 추출한 저대역 LPC 계수를 이용하여 고대역 여기신호를 생성하기 위한 고대역 여기신호 생성수단; 상기 저대역 LPC 계수 추출수단에서 추출한 저대역 LPC 계수로부터 고대역 LPC 계수를 생성하기 위한 고대역 LPC 계수 생성수단; 상기 고대역 여기신호 생성 수단에서 생성한 고대역 여기신호와 상기 고대역 LPC 계수 생성수단에서 생성한 고대역 LPC 계수를 이용하여 고대역 음성을 합성하기 위한 고대역 음성 합성수단; 및 상기 고대역 음성 합성수단을 통해 합성한 고대역 음성에 포함되어 있는 저대역 성분을 제거하여 고대역 합성 음성을 출력하기 위한 고대역 통과 필터링 수단을 포함하되, 상기 고대역 여기신호 생성수단은, 상기 저대역 복호화부로부터 전달받은 저대역 합성 음성에 대해 상기 저대역 LPC 계수 추출수단에서 추출한 저대역 LPC 계수를 이용한 LPC 분석 과정을 적용하여 저대역 여기신호를 출력하기 위한 저대역 여기신호 추출수단; 상기 저대역 여기신호 추출수단으로부터 출력되는 저대역 여기신호의 거울 이미지를 고대역에 생성하기 위해 고대역 합성 음성의 샘플링 주파수에 맞도록 샘플링 주파수를 변환하기 위한 주파수 변환수단; 및 상기 주파수 변환수단을 통해 샘플링 주파수를 변환한 여기신호에서 저대역 성분을 제거하여 고대역 여기신호를 출력하기 위한 고대역 여기신호 추출수단을 포함함. 4. 발명의 중요한 용도 본 발명은 대역-분할 광대역 음성 코덱 등에 이용됨. 고대역, 저대역, 고대역 오류 은닉, 광대역 합성 음성
Abstract:
음성부호화기에서 적응 코드북 검색기 및 그 방법이 개시된다. 상기 과제를 이루기 위해, G.723.1 음성 부호화기에서 본 발명에 따른 적응 코드북 검색기는 1차 피치 예측을 통해 적응 코드북 목표신호와의 오차가 최소인 폐-루프 피치 지연과 이득을 검색하는 1단계 검색기 및 1단계 검색기에서 검색된 이득을 이용하여 이득 테이블을 선택하고, 5차 피치 예측을 통해 적응 코드북 목표신호와의 오차를 최소로 하는 이득을 선택된 이득 테이블에서 검색하는 2단계 검색기를 포함하며, 1단계 검색기에서 검색된 폐-루프 피치 지연과 2단계 검색기에서 검색된 피치 이득을 적응 코드북 검색 결과로 하는 것을 특징으로 하며, 종래와 비슷한 성능을 가지면서 계산량을 줄임으로써, 효율적인 음성 부호화기를 구현 가능할 수 있다. 또한, 단일 채널 시스템뿐만 아니라 다채널 음성 저장 시스템이나 다채널 통화를 지원하는 게이트웨이와 같은 시스템을 보다 효과적으로 구현할 수 있다.
Abstract:
본 발명은 입력 음성 신호의 특성에 따라 입력 음성 신호의 등급을 분류하고 분류한 등급에 대응하는 프레임 크기, 양자화기 구조 및 비트 할당 구조를 사용하여 부호화를 수행하거나, 네트워크의 상태 또는 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임 크기를 조정할 수 있는 음성 부호화/복호화 장치 및 그 방법에 관한 것이다. 본 발명은 입력 음성의 특성에 따라 프레임의 크기와 양자화기 구조 및 비트 할당을 최적으로 조정하여 음성 부호화 장치의 성능을 향상 시킬 수 있으며, 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임의 크기를 조정함으로써 전체 통화 지연을 줄일 수 있다.