Abstract:
음성합성기를 구축하기 위한 음소열 기반의 음성합성 훈련용 문장 선정 장치 및 그 동작 방법이 개시된다. 본 발명은 복수의 문장들 중 상기 복수의 문장들 전체에서 분포하고 있는 음소열의 분포와 유사한 음소열 분포를 갖는 문장들을 음성합성 훈련용 문장들로 선택할 수 있는 기법을 제시함으로써, 사용자가 음성합성기를 구축하기 위한 발화 데이터를 만들고자 할 때, 적은 수의 문장들만으로도 고효율의 발화 데이터를 만들 수 있도록 지원할 수 있다.
Abstract:
본 발명에 의한 발화검증 시스템은, 입력 음성신호로부터 음성의 특징을 표현하는 특징벡터를 추출하는 특징벡터 추출부, 추출된 특징벡터로부터 음성인식을 수행하고, 음색도 추출부로 음소레벨의 인식정보를 전달하는 음성인식부, 음소레벨의 인식정보, 반모델 및 단어음색 모델을 이용하여 음소레벨 로그우도 음색도와 음소레벨 지속시간 음색도를 구하고, 각각으로부터 단어레벨 로그우도 음색도와 단어레벨 지속시간 음색도를 추출하는 음색도 추출부 및, 음색도 추출부에서 출력된 단어레벨 로그우도 음색도와 단어레벨 지속시간 음색도를 이용하여 음성인식된 결과에 대해 수락 또는 거절을 결정하는 발화검증부를 구비한다.
Abstract:
PURPOSE: An acoustic model parameter adaptation device using histogram equalization and a method thereof are provided to remove acoustic mismatch between test environment and drill environment, thereby preventing voice recognition performance which is strong against noise environment. CONSTITUTION: A test accumulative distribution function estimator(11) estimates test accumulative distribution function estimation about test voice feature parameters. A drill accumulative distribution function estimator(12) estimates drill accumulative distribution function estimation about a sound model average parameters. A linear interpolation factor calculator(13) obtains linear interpolation factor. A sound model parameter adapter(14) performs linear interpolation about the test voice feature parameter which the voice model average parameter performs through histogram equalization.
Abstract:
A voice recognition system and a method using histogram equalization technique by window base cumulative distribution function estimation are provided to reduce the degradation of voice recognition performance in the environment with noise. A voice input unit converts an analog voice signal into a digital signal(200). A characteristic extraction unit extracts an acoustic feature parameter in the frame unit(202), after dividing the digital voice signal in to a regular time interval(201). A characteristic compensation unit extracts a compensated feature parameter(203). A voice recognition engine performs a voice recognition and outputs the acknowledged result(204).
Abstract:
본 발명의 실시예에 따르면, GMM에 기반한 통계 모델 방식을 이용하는 화자 검증 장치의 화자 검증 방법이 제공된다. 화자 검증 장치는 제1 화자의 제1 입력 음성으로부터 추출된 적어도 하나의 제1 특징 파라미터를 이용해, 상기 제1 화자를 위한 제1 화자 GMM 모델을 생성한다. 그리고 화자 검증 장치는 적어도 하나의 제2 화자의 입력 음성으로부터 추출된 적어도 하나의 제2 특징 파라미터를 이용해, 상기 제1 화자에 대응하는 제1 UBM 모델을 주변 음향 환경에 적응시킨다. 그리고 화자 검증 장치는 제2 입력 음성으로부터 추출된 적어도 하나의 제3 특징 파라미터에 대한 상기 제1 UBM 모델의 제1 우도와, 상기 제3 특징 파라미터에 대한 상기 제1 화자 GMM 모델의 제2 우도를 비교하고, 상기 비교 결과에 기초해 상기 제2 입력 음성이 상기 제1 화자의 음성인지를 판단한다.
Abstract:
본 발명은 잡음 환경에서 음성 인식기와 화자 인식기의 인식성능을 보장하기 위해 사용되는 음성 검출 장치 및 방법에 관한 것으로서, 본 발명의 음성 검출 장치는 신호를 입력받기 위한 입력수단 및 상기 입력수단으로부터 입력된 신호의 우도비(likelihood ratio)를 산출하고, 산출된 우도비 중에서 주파수 빈(bin)의 파워에 따라 우도비를 선택하고, 선택된 우도비를 사용하여 음성신호를 검출하기 위한 분석수단을 포함한다. 본 발명에 의하면 음성 검출 장치에서 우도비의 주파수 빈 파워를 기반으로 우도비를 선택적으로 이용함으로써, 음성 검출 성능을 향상시킬 수 있는 효과가 있다. 음성 인식, 화자 인식, 검출, 우도비, 주파수 빈, 파워, 푸리에 변환.