Abstract:
A method for recognizing the voice in a noise environment by using the uncertainty information of a sub-band and an apparatus therefor are provided to extract the voice features stronger against the noise by extracting the uncertainty information of estimated voices of each sub-band from an estimated voice obtained through the noise signal modeling, and then weighted values fro each sub-band. A feature extracting module(100) estimates a voice in which noise is removed from the inputted voice signal, extracts the uncertainty information of each sub-band in the estimated voice, and then extracts the voice features by using the extracted uncertainty information as sub-band weighted values. A voice recognition module(200) converts the acoustic model according to the sub-band weighted values to perform the voice recognition based on the converted acoustic model and extracted voice features.
Abstract:
A speech recognition apparatus and a method thereof are provided to increase a speech recognition speed by reducing the quantity of observation probability calculations. A speech recognition apparatus using a feature vector of a speech signal includes an activated node selector(200), an observation probability calculation method determination unit(210), an observation probability calculator(220), and a speech recognition result generator(230). The activated node selector selects activated nodes by using the feature vector. The observation probability calculation method determination unit determines an observation probability calculation method by using the number of activated nodes selected by the activated node selector. The observation probability calculator obtains observation probability according to the determined observation probability calculation method. The speech recognition result generator performs speech recognition by using the obtained observation probability and outputs the speech recognition result.
Abstract:
본 발명은 고빈도 의사형태소열을 하나의 인식단위로 활용하여, 의사형태소와 어절의 중간형태의 인식단위를 생성하도록 하는 대화체 및 낭독체 대어휘 연속음성인식시스템의 고빈도 어휘열 인식단위 생성장치 및 그 방법에 관한 것이다. 이와 같은 본 발명은 의사형태소 태깅된 텍스트 코퍼스로부터 연속된 어휘쌍 빈도정보를 추출하는 빈도정보 추출부(301)와, 상기 빈도정보 추출부(301)에서 추출된 빈도정보와 상기 각 어휘쌍의 길이정보을 바탕으로 결합할 어휘셋을 선정하는 결합 어휘셋 선정부(302)와, 상기 결합 어휘셋 선정부(302)에서 선정된 어휘셋을 기반으로 상기 텍스트 코퍼스를 수정한 후, 고빈도 연속 어휘쌍을 하나로 결합하여 수정된 텍스트 코퍼스를 생성하는 의사형태소 결합 정보 수정부(303)와, 상기 의사형태소 결합 정보 수정부(303)에서 생성된 텍스트 코퍼스를 바탕으로 고빈도 어휘열 인식단위를 생성하는 인식단위 생성부(304)로 구성된다. 대화체 및 낭독체 대어휘, 텍스트 코퍼스, 어휘사전, 언어모델, 발음사전