Abstract:
본 발명은 화자인식시스템의 화자 특징벡터 생성방법 및 시스템에 관한 것으로서, 입력된 화자 음성신호에서 특징벡터를 추출하여 화자모델링 훈련 및 화자인식을 수행하는 화자인식시스템에 있어서, 입력된 화자음성신호의 피치간격을 측정하고 소정의 피치구간 음성신호를 추출하는 피치구간 음성추출수단, 피치구간음성추출수단에서 추출된 음성신호의 특징벡터를 생성하는 특징벡터생성수단을 포함하여 이루어진 것을 특징으로 한다.
Abstract:
The present invention relates to a transmitter and a receiver for speech coding and decoding by using an additional bit allocation method. The transmitter and the receiver according to the present invention realize a voice communication service of high quality by using additional bits permitted in system requirements while using a conventional speech coder as it is. In addition, the transmitter and the receiver according to the present invention have an advantage in that they enable insertion of additional quantization blocks while not changing the structure of the conventional standard speech coder, since they allocate additional bits by applying a multi-stage quantization procedure not in a speech signal domain but in a parameter domain.
Abstract:
PURPOSE: An apparatus and a method for transcoding data between speech codecs having different CELP(Code Excited Linear Prediction) types are provided to reduce quantity of calculation and offer speech with high quality by utilizing one transcoding filter instead of a post-processing filter and a perception weighting filter. CONSTITUTION: A decoding process part(321) converts a bitstream with an input CELP codec format into a speech signal, wherein the bitstream is formed by coding an input speech signal. A transcoding filter(323) filters the decoded speech signal by filter characteristics calculated by adopting an optimal weighting value for minimum spectrum distortion. A transcoding filter design part(322) extracts the optimal weighting value from a weighting value set comprised of a plurality of weighting value pairs. A coding process part(324) codes the speech signal processed by the transcoding filter and thereby generates a bitstream of an output CELP codec format.
Abstract:
PURPOSE: A wideband voice encoder, a method therefor, a wideband decoder and a method therefor are provided to offer excellent voice quality in a voice interval which is not processed by an algebraical codebook by performing multi-stage fixed codebook retrieval. CONSTITUTION: A voice characteristic classifying unit(105) classifies the characteristic of a voice corresponding to a current frame using an open-loop pitch value of a recognition weight filtered signal of a wideband voice signal and a linear prediction factor by a statistical method. An adaptive codebook retrieving unit(106) retrieves a pitch delay value near the open-loop pitch value, calculates a pitch gain value, and generates an adaptive codebook contribution signal. The adaptive codebook retrieving unit outputs difference between the generated adaptive codebook contribution signal and the recognition weight filtered signal as a primary fixed codebook target signal. A primary fixed codebook retrieving unit(107) obtains a primary fixed codebook index and a primary fixed codebook gain value, generates a primary fixed codebook contribution signal corresponding to the obtained primary fixed codebook index. The primary fixed codebook retrieving unit outputs different between the generated primary fixed codebook contribution signal and the primary fixed codebook target signal as a secondary codebook target signal. A secondary fixed codebook retrieving unit(108) has at least two or more fixed codebooks according to voice characteristics, selects one secondary fixed codebook according to voice characteristic information, and retrieves secondary fixed codebook indexes and secondary fixed codebook gain values according to the voice characteristics. A parameter multiplexing unit(110) multiplexes voice characteristic information, the pitch delay value, the pitch gain value, the primary fixed codebook index, the primary fixed codebook gain value, the secondary fixed codebook indexes and the secondary fixed codebook gain values, generates a bit stream, and transmits the bit stream to an external voice decoding terminal.
Abstract:
PURPOSE: An apparatus and a method for transmitting/receiving a wideband voice signal are provided to offer high sound quality 16 kHz sampled wideband voice signal and compatibility with an existing system. CONSTITUTION: A analyzing/filtering unit(301) receives a digital voice signal and outputs a low band voice signal having a bandwidth of 0-4 kHz of 8 kHz sampling period. A low band standard coding unit(302) receives the low band voice signal, codes it and outputs a coded low band standard signal. A low band additional coding unit(304) receives a difference between a filtered low band voice signal and a composite signal that has been decoded by a low band standard decoding unit(303) and codes them to generate a low band additional signal. An enhancement residual band coding unit(306) up-samples a composite signal obtained by combining signals outputted from the low band standard decoding unit(303) and the low band additional decoding unit(305), obtains a difference between the up-sampled signal and a voice signal inputted to the analyzing/filtering unit(301), and generates an enhancement residual band signal.
Abstract:
본 발명은 입력 음성 신호의 특성에 따라 입력 음성 신호의 등급을 분류하고 분류한 등급에 대응하는 프레임 크기, 양자화기 구조 및 비트 할당 구조를 사용하여 부호화를 수행하거나, 네트워크의 상태 또는 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임 크기를 조정할 수 있는 음성 부호화/복호화 장치 및 그 방법에 관한 것이다. 본 발명은 입력 음성의 특성에 따라 프레임의 크기와 양자화기 구조 및 비트 할당을 최적으로 조정하여 음성 부호화 장치의 성능을 향상 시킬 수 있으며, 통화 상대방이 사용하는 음성 부호화기의 종류에 따라 프레임의 크기를 조정함으로써 전체 통화 지연을 줄일 수 있다.
Abstract:
본 발명은 화자인식시스템의 화자 특징벡터 생성방법 및 시스템에 관한 것으로서, 입력된 화자 음성신호에서 특징벡터를 추출하여 화자모델링 훈련 및 화자인식을 수행하는 화자인식시스템에 있어서, 입력된 화자음성신호의 피치간격을 측정하고 소정의 피치구간 음성신호를 추출하는 피치구간 음성추출수단, 피치구간음성추출수단에서 추출된 음성신호의 특징벡터를 생성하는 특징벡터생성수단을 포함하여 이루어진 것을 특징으로 한다.
Abstract:
광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기 및 그 방법이 개시된다. 본 발명에 따른 광대역 음성 부호화기는 부호화할 광대역 음성신호의 개회로 피치값과 선형예측계수를 이용하여 현재 프레임에 해당하는 음성의 특성을 규정하는 음성 특성 분류부, 적응 코드북을 검색하여 적응 코드북 피치 지연값 및 적응 코드북 피치 이득값을 얻고, 1차 고정 코드북 목적신호를 생성하는 적응 코드북 검색부, 1차 고정 코드북을 검색하여 1차 고정 코드북 인덱스와 1차 고정 코드북 이득값을 얻고, 2차 고정 코드북 목적신호를 생성하는 1차 고정 코드북 검색부, 음성 특성에 따라 적어도 둘 이상의 2차 고정 코드북들을 구비하며, 음성 특성 정보에 따라 하나의 2차 고정 코드북을 선택 및 검색하여 2차 고정 코드북 인덱스들과 2차 고정 코드북 이득값들 검색하는 2차 고정코드북 검색부 및 각 부에서 얻어지는 파라미터들을 양자화 및 다중화하여 비트열로 만들어 외부의 음성 복호화단으로 전송하는 파라미터 다중화부를 포함하는 것을 특징으로 하며, 음성 특성에 따라 2개 이상으로 구성된 2차 고정 코드북들로부터 음성 특성에 적합한 2차 고정 코드북을 선택함으로써 광대역 음성신호에 대해 보다 우수한 음질을 제공할 수 있다.
Abstract:
본 발명은 스테레오로 레코딩된 원 음장을 두 개의 스피커를 이용하여 양쪽 귀 주변에서 완벽히 재생하기 위한 크로스톡(crosstalk) 제거 방법 및 제거필터에 관한 것이며, 특히 저주파 대역에서의 성능을 개선하기 위한 주파수-워핑기술에 관한 것으로서, pole-zero 디워핑(dewarping)을 통하여 적은 연산량으로 종래의 기술과 유사한 성능을 제공한다. 크로스톡 제거기, minimum phase, 주파수-워핑, least squares, pole-zero modeling, pole-zero 디워핑)
Abstract:
본 발명의 목적을 달성하기 위한 보완적 특징벡터를 이용한 화자특징벡터 생성방법 및 장치에 관한 것으로서, 본 발명의 목적은 입력된 화자 음성신호에서 특징벡터를 추출하여 화자모델링 훈련 및 화자인식을 수행하는 화자인식시스템에 있어서, 상기 입력된 음성신호에 목적화자와 사칭화자에 따라 서로 다른 제한된 환경의 보완적 특징을 첨가하는 보완특징첨가수단과, 상기 보완특징첨가수단을 통해 보완적 특징이 첨가된 음성신호의 특징벡터를 추출하는 특징벡터생성수단을 포함하여 구성된 것을 특징으로 한다. 화자, 목적화자, 사칭화자, 음성, 인식, 특징, 벡터, 추출, 생성, 보완, 제한적 환경