Abstract:
An encoding/decoding apparatus and a method thereof are provided to encode signals having different features such as an audio signal and a voice signal at an optimum bit rate. A plurality of signals encoded from an input bit stream is extracted. A method for decoding a signal is determined with regard to the encoded signals among a plurality of decoding methods. The signals are decoded according to the determined decoding method. The decoded signals are synthesized. An original signal is restored by performing a post process with regard to the synthesized signal.
Abstract:
An apparatus and a method for discriminating an unidentified signal using a reference model are provided to analyze characteristic parameters at every time regions and thus to discriminate a sound/music signal in real time. A method of discriminating an unidentified signal using a reference model includes the steps of converting the unidentified sound/music signal into a frequency/time region(S501), extracting characteristic parameters from the unidentified sound/music signal in the frequency/time region(S502), comparing the extracted characteristic parameters with a reference model and discriminating the kind of the unidentified sound/music signal(S503), providing information on the reference model, converting the unidentified sound/music signal into the frequency/time region(S506), and extracting characteristic parameters from the sound/music signal.
Abstract:
본 발명은 객관적인 음성 품질의 평가방법에 관한 것으로서, 더욱 상세하게는 원음에 대한 정보를 제공받지 아니하고 합성된(왜곡된) 음성에 대한 정보만으로 패킷 손실에 가중치를 부여함으로써 음성 품질을 평가하는 객관적인 음성 품질의 평가방법에 관한 것이다. 이를 위해, 본 발명은 객관적인 음성 품질의 평가방법에 있어서, 음성 복호화기에서 통신채널을 통과한 음성 신호를 복호하고 매 프레임마다 음성 신호를 합성하는 제 1 단계; 음성 특성 분류기에서 상기 1 단계에서 합성된(왜곡된) 음성신호를 통계적 특성에 따라서 분류하는 제 2 단계; 패킷 손실 감지기에서 상기 음성 복호화기를 통과하여 합성된 왜곡음을 받아 상기 음성 복호화기를 통과하면서 발생한 패킷 손실의 발생 여부를 감지하는 제 3 단계;및 상기 제 3 단계에서 패킷 손실이 감지되면 상기 패킷 손실에 가중치를 부여함으로써 음성 품질을 평가하는 제 4 단계를 포함하여 이루어지는 것을 특징으로 하는 객관적인 음성 품질의 평가방법을 제공한다. 음성 품질, 음성 품질 평가, 싱글 엔드, 더블 엔드, 패킷 손실, 가중치, 비침입적, 침입적, 객관적, 주관적 평가 방법
Abstract:
본 발명은 객관적인 음성 품질의 평가방법에 관한 것으로서, 더욱 상세하게는 원음에 대한 정보를 제공받지 아니하고 합성된(왜곡된) 음성에 대한 정보만으로 패킷 손실에 가중치를 부여함으로써 음성 품질을 평가하는 객관적인 음성 품질의 평가방법에 관한 것이다. 이를 위해, 본 발명은 객관적인 음성 품질의 평가방법에 있어서, 음성 복호화기에서 통신채널을 통과한 음성 신호를 복호하고 매 프레임마다 음성 신호를 합성하는 제 1 단계; 음성 특성 분류기에서 상기 1 단계에서 합성된(왜곡된) 음성신호를 통계적 특성에 따라서 분류하는 제 2 단계; 패킷 손실 감지기에서 상기 음성 복호화기를 통과하여 합성된 왜곡음을 받아 상기 음성 복호화기를 통과하면서 발생한 패킷 손실의 발생 여부를 감지하는 제 3 단계;및 상기 제 3 단계에서 패킷 손실이 감지되면 상기 패킷 손실에 가중치를 부여함으로써 음성 품질을 평가하는 제 4 단계를 포함하여 이루어지는 것을 특징으로 하는 객관적인 음성 품질의 평가방법을 제공한다. 음성 품질, 음성 품질 평가, 싱글 엔드, 더블 엔드, 패킷 손실, 가중치, 비침입적, 침입적, 객관적, 주관적 평가 방법
Abstract:
A system and a method for recognizing a speaker by using the combination of a filter bank with resolution by various frequencies are provided to obtain a characterization vector of the speaker by means of several filter banks. When voice data of a speaker are inputted, a filter tank member inserts the voice data into each filter tank and extracts the characteristic vectors as much as the number of the filter banks(S31-S32). A probability calculating member calculates the probability for generating characteristic vectors related to the voices from the speaker models stored in a speaker model storage member(S33). Thereafter, when the probability value related to the generation of the characteristic vector is calculated from the extracted plural characteristic vectors, the speaker is determined by the combination of log probability values at the probability value adding up member(S34).
Abstract:
본 발명은 TTS(Text-To-Speech) 시스템에서 음성 합성에 사용되는 대용량 데이터베이스를 압축 및 합성하기 위한 것이다. 보다 상세히는 TTS 시스템의 음성압축 및 합성 방법에 있어, 화자 종속적 코드북을 이용하는 것인데, 상기 화자 종속적 코드북은 시간 축에서 잔차 신호 파형의 유사도를 비교함으로써 다양한 형태의 신호로 코드북을 훈련시켜 코드북을 생성하는 것을 특징으로 한다. 또한 본 발명의 TTS 시스템을 지원하기 위해 코덱은 과거 정보가 없는 음소의 시작 부분에서는 화자 종속적 잔차신호 코드북을 사용하고, 그 이후의 음성 신호에 대해선 예측 방식을 사용함으로써 상용 코덱 수준의 압축률을 가지면서도 음소 단위의 가변적이고 부분적인 음성 합성에 있어 우수한 음질을 제공하는 효과가 있다. TTS, 음성합성, 화자종속, 코드북, 예측방식
Abstract:
광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기 및 그 방법이 개시된다. 본 발명에 따른 광대역 음성 부호화기는 부호화할 광대역 음성신호의 개회로 피치값과 선형예측계수를 이용하여 현재 프레임에 해당하는 음성의 특성을 규정하는 음성 특성 분류부, 적응 코드북을 검색하여 적응 코드북 피치 지연값 및 적응 코드북 피치 이득값을 얻고, 1차 고정 코드북 목적신호를 생성하는 적응 코드북 검색부, 1차 고정 코드북을 검색하여 1차 고정 코드북 인덱스와 1차 고정 코드북 이득값을 얻고, 2차 고정 코드북 목적신호를 생성하는 1차 고정 코드북 검색부, 음성 특성에 따라 적어도 둘 이상의 2차 고정 코드북들을 구비하며, 음성 특성 정보에 따라 하나의 2차 고정 코드북을 선택 및 검색하여 2차 고정 코드북 인덱스들과 2차 고정 코드북 이득값들 검색하는 2차 고정코드북 검색부 및 각 부에서 얻어지는 파라미터들을 양자화 및 다중화하여 비트열로 만들어 외부의 음성 복호화단으로 전송하는 파라미터 다중화부를 포함하는 것을 특징으로 하며, 음성 특성에 따라 2개 이상으로 구성된 2차 고정 코드북들로부터 음성 특성에 적합한 2차 고정 코드북을 선택함으로써 광대역 음성신호에 대해 보다 우수한 음질을 제공할 수 있다.
Abstract:
본 발명은 입력 음성 신호의 특성에 따라 입력 음성 신호의 등급을 분류하고 분류한 등급에 대응하는 프레임 크기, 양자화기 구조 및 비트 할당 구조를 사용하여 부호화를 수행하거나, 네트워크의 상태 또는 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임 크기를 조정할 수 있는 음성 부호화/복호화 장치 및 그 방법에 관한 것이다. 본 발명은 입력 음성의 특성에 따라 프레임의 크기와 양자화기 구조 및 비트 할당을 최적으로 조정하여 음성 부호화 장치의 성능을 향상 시킬 수 있으며, 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임의 크기를 조정함으로써 전체 통화 지연을 줄일 수 있다.
Abstract:
A system for transmitting and receiving a wideband speech signal includes an A/D converter for receiving an analog speech signal to convert it into a digital speech signal, encoding a difference between a baseband speech signal and a standard baseband between a synthesized standard baseband signal, and an IP network interface for multiplexing the coded standard and additional baseband signals and enhancement residual band signal.
Abstract:
PURPOSE: A method for allocating sub-channels in OFDM communication and a recoding medium for storing an allocation program are provided to form a simple bit-loading algorithm by using a modulation/demodulation level as feedback information. CONSTITUTION: A base station receives modulation/demodulation levels and average receiving S/N ratios from each terminal(S1). Users are sorted according to the average receiving S/N ratios(S2). Sub-channels are selected by using the maximum modulation/demodulation level and the maximum average receiving S/N ratio after the users are sorted according to the average receiving S/N ratio(S3). The selected sub-channels are assigned to the users(S4-S7).