Abstract:
PURPOSE: An apparatus and a method for estimating an open-loop pitch are provided to reduce quantity of calculation and improve quality of sound in a transcoder between speech codecs of different CELP(Code Excited Linear Prediction) types. CONSTITUTION: A decoding process part(401) decodes a coded bitstream having an input CELP codec format and extracts a closed-loop pitch for each sub-frame of a decoded speech signal from the bitstream. A perception weighting filter(402) performs filtering by perception weighting in view of the decoded speech signal. An open-loop pitch search part(407) searches an open-loop pitch within a search range of the open-loop pitch. The search range is determined by using a decoded closed-loop pitch and a previous open-loop pitch of the same frame. A closed-loop pitch search part(408) searches the closed-loop pitch of a speech signal filtered by perception weighting, by utilizing the searched open-loop pitch, and outputs the searched result as a pitch delay value of an output CELP codec format.
Abstract:
A voice and audio signal encoding/decoding apparatus and a method thereof are provided to efficiently and simultaneously encode/decode voice and audio signals. A signal separation part(110) separates an input signal into signals having different frequency bands. A phase and amplitude information extracting unit(120) extracts momentary phase and momentary amplitude information of each of the separated signal by performing Hilbert conversion of the separated signal. An encoder(130) encodes each of the separated signal by using the extracted momentary phase and momentary amplitude information.
Abstract:
본 발명은 OFDMA 통신시스템에서 이용되는 통신방법, 단말기, 통신장치 및 채널예측장치에 관한 것이다. 본 발명의 통신시스템에서는, 단말기가 기지국으로부터 수신된 데이터를 토대로 채널상태를 추정하는 채널정보를 생성하고, 채널정보를 토대로 단말기의 시변다중채널환경에 따라 후속채널의 채널예측정보를 생성하고, 이 채널예측정보를 토대로 신호송신조건을 결정한다. 이렇게 결정된 신호송신조건을 포함하는 분산처리피드백정보는 기지국으로 전송된다. 본 발명에 따르면, 채널 정보인 피드백정보를 각 사용자 단말기에서 처리함으로써, 기지국의 신호 처리량이 현저하게 감소된다. 또한, 채널환경에 따라 생성된 채널예측정보를 토대로 신호송신조건을 결정하므로, 시변다중채널환경하에서도 시스템의 성능저하를 방지할 수 있다. OFDMA 통신시스템, 피드백정보, 예측기, 적응변조/부호화
Abstract:
서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 장치 및 그 방법이 개시된다. 본 발명에 따른 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 장치는 서로 다른 포맷을 갖는 입력 CELP 코덱과 출력 CELP 코덱 사이에서, 입력 CELP 코덱의 포맷을 출력 CELP 코덱의 포맷으로 변환하는 본 발명에 따른 상호부호화 장치는 입력 CELP 코덱 포맷으로 부호화된 비트스트림를 음성 신호로 변환하는 입력 CELP 코덱의 복호화 처리부, 기준필터를 기준으로, 스펙트럼 왜곡이 최소가 되는 최적의 가중치를 적용하여 계산되는 필터 특성으로 입력 CELP 코덱의 복호화 처리부에서 복호화된 음성신호를 필터 처리하는 상호부호화 필터, 다수의 가중치로 이루어진 가중치 세트로부터 상호부호화 필터의 스펙트럼 왜곡을 최소화하는 최적의 가중치를 추출하여 상호부호화 필터로 제공하는 상호부호화 필터 설계부 및 상호부호화 필터에서 필터 처리된 음성신호를 부호화하여 출력 CELP 코덱 포맷의 비트스트림를 생성하는 출력 CELP 코덱의 부호화 처리부를 포함하는 것을 특징으로 하고, 하나의 상호부호화 필터를 이용하여 종래의 후-필터 및 지각가중필터를 대신함으로써, 상호부호화기의 연산량을 감소시키면서도 수신단에서 복호화된 음성의 음질을 향상시킬 수 있다.
Abstract:
상호부호화기에서 개회로 피치 추정 방법 및 그 장치가 개시된다. 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화를 위한 상호부호화기에서 본 발명에 따른 개회로 피치 추정 방법은, 입력 CELP 코덱 포맷으로 부호화된 비트스트림를 음성 신호로 복호화하고, 복호화된 음성신호의 각 부-프레임에 대한 폐-루프 피치를 추출하는 (a)단계, 복호화된 음성 신호를 사람의 청각기관 특성을 고려한 지각가중필터 처리를 하는 (b)단계, 복호화된 폐-루프 피치와, 이전 프레임의 마지막 부-프레임에 대한 폐-루프 피치 또는 동일 프레임에 대한 이전 개-루프 피치를 이용하여 결정된 개-루프 피치 검색 범위에서 지각가중필터링된 음성신호의 개-루프 피치를 검색하는 (c)단계 및 검색된 개-루프 피치를 이용하여 결정된 폐-루프 피치 검색 범위에서 지각가중 필터링된 음성신호의 폐-루프 피치를 검색하고, 검색된 결과를 출력 CELP 코덱 포맷의 피치 지연값으로서 생성하는 (d)단계를 포함하는 것을 특징으로 하며, 기존 재-검색 방식보다 음질 저하를 줄일 수 있으며, 계산량 감소 효과를 얻을 수 있다.
Abstract:
PURPOSE: A transceiver for encoding and decoding voice using an additional bit assignment method is provided to offer a high-quality voice service by assigning only additional bits admitted in a system using a voice encoder used in an old voice processing system. CONSTITUTION: A standard voice encoding unit(102) classifies an inputted voice signal into spectrum information indicating a vocal tract transfer function and an excitation signal component, and models and quantizes spectrum information and the excitation signal component. The standard voice encoding unit(102) performs the standard encoding of the quantized signal, and generates a standard-encoded bit series. A quality improvement encoding unit(103) obtains an error between a signal in which spectrum information is not quantized and a signal in which spectrum information is quantized by the standard voice encoding unit(102). The quality improvement encoding unit(103) obtains an error between a signal in which the excitation signal component is not quantized and a signal in which the excitation signal component is quantized. The quality improvement encoding unit(103) additionally quantizes the obtained errors, and generates an encoded bit series. A multiplexing unit(104) multiplexes the bit series obtained in the standard voice encoding unit(102) and the quality improvement encoding unit(103), and transmits the multiplexed bit series.
Abstract:
본 발명은 음성 및 오디오 신호의 코딩 및 디코딩에 관한 것으로서, 더욱 구체적으로는 HHT(Hilbert-Huang Transform)을 이용하여 음성 및 오디오신호와 같이 비정규적(non-stationary) 특성이 강한 입력신호를 동시에 부호화 및 복호화 할 수 있는 장치 및 방법에 관한 것이다. 본 발명은 입력신호에 대하여 HHT를 적용하여 각기 다른 주파수 대역을 갖는 신호들로 분리하는 단계와, 상기 분리된 신호 각각을 독립적으로 부호화하는 단계 및 상기 독립적으로 부호화된 각각의 신호를 다중화하는 단계를 포함하는 부호화 방법을 제공한다. 힐버트 변환, EMD, HHT, intrinsic mode function,
Abstract:
The present invention relates to a transmitter and a receiver for speech coding and decoding by using an additional bit allocation method. The transmitter and the receiver according to the present invention realize a voice communication service of high quality by using additional bits permitted in system requirements while using a conventional speech coder as it is. In addition, the transmitter and the receiver according to the present invention have an advantage in that they enable insertion of additional quantization blocks while not changing the structure of the conventional standard speech coder, since they allocate additional bits by applying a multi-stage quantization procedure not in a speech signal domain but in a parameter domain.
Abstract:
PURPOSE: An apparatus and a method for transcoding data between speech codecs having different CELP(Code Excited Linear Prediction) types are provided to reduce quantity of calculation and offer speech with high quality by utilizing one transcoding filter instead of a post-processing filter and a perception weighting filter. CONSTITUTION: A decoding process part(321) converts a bitstream with an input CELP codec format into a speech signal, wherein the bitstream is formed by coding an input speech signal. A transcoding filter(323) filters the decoded speech signal by filter characteristics calculated by adopting an optimal weighting value for minimum spectrum distortion. A transcoding filter design part(322) extracts the optimal weighting value from a weighting value set comprised of a plurality of weighting value pairs. A coding process part(324) codes the speech signal processed by the transcoding filter and thereby generates a bitstream of an output CELP codec format.
Abstract:
PURPOSE: A wideband voice encoder, a method therefor, a wideband decoder and a method therefor are provided to offer excellent voice quality in a voice interval which is not processed by an algebraical codebook by performing multi-stage fixed codebook retrieval. CONSTITUTION: A voice characteristic classifying unit(105) classifies the characteristic of a voice corresponding to a current frame using an open-loop pitch value of a recognition weight filtered signal of a wideband voice signal and a linear prediction factor by a statistical method. An adaptive codebook retrieving unit(106) retrieves a pitch delay value near the open-loop pitch value, calculates a pitch gain value, and generates an adaptive codebook contribution signal. The adaptive codebook retrieving unit outputs difference between the generated adaptive codebook contribution signal and the recognition weight filtered signal as a primary fixed codebook target signal. A primary fixed codebook retrieving unit(107) obtains a primary fixed codebook index and a primary fixed codebook gain value, generates a primary fixed codebook contribution signal corresponding to the obtained primary fixed codebook index. The primary fixed codebook retrieving unit outputs different between the generated primary fixed codebook contribution signal and the primary fixed codebook target signal as a secondary codebook target signal. A secondary fixed codebook retrieving unit(108) has at least two or more fixed codebooks according to voice characteristics, selects one secondary fixed codebook according to voice characteristic information, and retrieves secondary fixed codebook indexes and secondary fixed codebook gain values according to the voice characteristics. A parameter multiplexing unit(110) multiplexes voice characteristic information, the pitch delay value, the pitch gain value, the primary fixed codebook index, the primary fixed codebook gain value, the secondary fixed codebook indexes and the secondary fixed codebook gain values, generates a bit stream, and transmits the bit stream to an external voice decoding terminal.