-
公开(公告)号:KR100480790B1
公开(公告)日:2005-04-06
申请号:KR1020030005483
申请日:2003-01-28
Applicant: 삼성전자주식회사
IPC: G10L15/14
Abstract: 양방향 N-그램 언어모델 추정방법 및 이를 이용한 연속 음성인식방법 및 장치가 개시된다. 양방향 N-그램 언어모델을 이용한 연속 음성인식방법은 (a) 학습용 텍스트 데이터베이스의 학습용 문장들에서의 단어열에 대한 발생빈도 데이타를 이용하여 연산되어진 단어열들의 전방향 N-그램 발생확률 데이터 및 역방향 N-그램 발생확률 데이터를 생성하고, 상기 전방향 N-그램 발생확률 데이터 및 역방향 N-그램 발생확률 데이터를 결합하여 생성된 양방향 언어모델 확률데이터를 갖는 양방향 언어모델 데이터베이스를 구축하는 단계; (b) 입력되는 음성으로부터 인식에 유용한 정보들을 추출하여 특징벡터로 변환하는 단계; 및 (c) 상기 음향모델 데이터베이스, 상기 발음사전 데이터베이스 및 상기 양방향 언어모델 데이터베이스를 참조하여 상기 특징추출부에서 변환된 특징벡터와 유사할 확률이 가장 높은 단어열을 탐색하고, 탐색된 단어열을 인식된 텍스트로서 출력하는 단계로 이루어진다. 이에 따르면, 탐색과정에 있어서 어순의 전방향 및 후방향 의존성 및 언어 고유의 구조적 특성을 반영할 수 있어 음성인식 성능을 향상시킬 수 있을 뿐 아니라 음성인식의 신뢰도를 대폭 증대시킬 수 있다.
-
公开(公告)号:KR1020040069060A
公开(公告)日:2004-08-04
申请号:KR1020030005483
申请日:2003-01-28
Applicant: 삼성전자주식회사
IPC: G10L15/14
Abstract: PURPOSE: A continuous speech recognition method and system using a two-way N-gram language model are provided to estimate the two-way N-gram language model based on two-way dependence between structural characteristic of a language and vocabularies. CONSTITUTION: Forward N-gram generation probability data of word strings calculated using generation frequency data with respect to word strings in drilling sentences constructed in a drilling text database is generated. Backward N-gram generation probability data of word strings calculated using the generation frequency data with respect to the word strings in the drilling sentences constructed in the drilling text database is generated. The forward N-gram generation probability data and the backward N-gram generation probability data are combined to generate two-way language model probability data.
Abstract translation: 目的:提供一种使用双向N-gram语言模型的连续语音识别方法和系统,以基于语言结构特征与词汇之间的双向依赖性来估计双向N语言语言模型。 构成:生成在钻孔文本数据库中构造的钻孔语句中使用关于字串的生成频率数据计算的字串的前向N代生成概率数据。 产生使用相对于在钻孔文本数据库中构造的钻孔语句中的字串的生成频率数据计算的字串的向后N代生成概率数据。 前向N-gram生成概率数据和后向N生成概率数据被组合以生成双向语言模型概率数据。
-