-
公开(公告)号:KR1020100069120A
公开(公告)日:2010-06-24
申请号:KR1020080127710
申请日:2008-12-16
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2755 , G06F17/18 , G06F17/30731
Abstract: PURPOSE: A morphological part-of-speech tagging method and a device thereof are provided to find suitable morphological part-of-speech about a prosody model of an input voice and tag morpheme part of speech based on result, thereby maximizing accuracy of morpheme part of speech tagging. CONSTITUTION: A morpheme analysis unit(203) analyzes morpheme about a text sentence based on morphological part-of-speech sequence prosody model. If ambiguity exists in the morpheme analysis result, a prosody model detector(207) detects prosody model about voice. A prosody model comparing/determining unit(209) compares a prosody model about the voice with the morphological part-of-speech sequence prosody model and determines morpheme part of speech sequence of a prosody model about the voice. A part-of-speech tagger(211) adds up part-of-speech sequence information of a prosody model about the voice in the morpheme part of speech sequence result and tags a part of speech.
Abstract translation: 目的:提供一种形态上的词性标注方法及其装置,以基于结果找到适合于输入语音和标签语素韵律模型的形态词语,从而最大化语素部分的准确性 的言语标签。 构成:语素分析单元(203)基于形态词语序列韵律模型分析文本句子的语素。 如果语素分析结果存在歧义,则韵律模型检测器(207)检测关于语音的韵律模型。 韵律模型比较/确定单元(209)将有关语音的韵律模型与形态词语序列韵律模型进行比较,并确定关于语音的韵律模型的语素序列的语素部分。 词性标签器(211)在语音序列结果的语素部分中加上关于语音的韵律模型的部分语音序列信息并标记语音部分。
-
62.
公开(公告)号:KR1020060070605A
公开(公告)日:2006-06-26
申请号:KR1020040109128
申请日:2004-12-21
Applicant: 한국전자통신연구원
IPC: G10L15/22 , G10L15/08 , G10L15/183
Abstract: 본 발명은 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치 및 방법에 관한 것으로, 특히 사용자의 음성 질의에 대해 음성 인식을 수행하는 음성 인식부(100); 사용자의 음성 질의에 대응되는 대화 모델을 이용하여 응답 문장을 생성하는 대화 처리부(200); 상기 응답 문장을 음성으로 변환하여 사용자에게 출력하는 음성 합성부(300); 및 대화 처리부(200)로부터 응답 문장을 입력받아 사용자에게 디스플레이시키는 디스플레이부(400)로 구성된 것을 특징으로 하며, 이러한 본 발명은 사용자 질의에 대한 음성 인식의 성능을 높여주고, 사용자의 다음 질문이나 답변을 예측할 수 있으므로, 보다 향상된 지능형 로봇 음성인식 서비스를 사용자에게 공급할 수 있는 효과가 있다.
지능형 로봇, 음성인식 서비스, 영역별 언어모델, 대화모델,-
公开(公告)号:KR1020060057921A
公开(公告)日:2006-05-29
申请号:KR1020040097115
申请日:2004-11-24
Applicant: 한국전자통신연구원
Abstract: 본 발명은 음성인식 결과인 단어들이나 문장에 대해 인식 오류를 수정하도록 하는 대화형 음성인식 시스템의 인식오류 수정장치 및 그 방법에 관한 것이다. 상기와 같은 목적을 달성하기 위한 본 발명의 대화형 음성인식 시스템의 인식오류 보정장치는, 음성을 입력하는 음성신호입력부와, 입력된 음성을 처리 분석하는 음성 분석부와, 언어 모델과 음향 모델을 이용하여 음성 분석 결과에 대해 음성 인식 처리를 수행하는 음성 인식부를 갖는 음성인식 시스템에 있어서, 음성인식 후처리를 위한 확률값을 미리 저장하고 있는 저장 수단과, 상기 저장 수단에 저장된 확률값을 이용하여 상기 음성 인식부에 의해서 인식된 결과의 오류를 수정하는 음성인식 후처리수단과, 상기 음성인식 후처리수단에서 수정된 음성인식 결과를 출력하는 인식결과 출력수단을 포함하여 구성되는 것을 특징으로 한다. 본 발명의 의한 대화형 음성인식 시스템의 인식오류 수정장치 및 그 방법은 음성인식의 오류를 줄여줌으로써 인식율을 향상시킬 수 있다.
음성인식, 음성인식 후처리, 음향모델, 언어모델, 인식오류 수정Abstract translation: 本发明涉及一种用于校正交互式语音识别系统中的识别错误的设备和方法,用于校正作为语音识别结果的单词或句子的识别错误。 本发明的用于实现上述目的的交互式语音识别系统的识别错误纠正设备,包括:声音信号输入单元,用于输入语音,和对于输入语音的处理分析,语言模型和声学模型的音频分析部分 通过使用存储在在具有用于对结果执行语音识别处理的语音识别的语音识别系统中的语音分析的概率值的语音,存储装置,存储装置,其预先存储用于处理和概率值,则语音识别 以及识别结果输出装置,用于输出由语音识别后处理装置校正的语音识别结果。 根据本发明的用于校正交互式语音识别系统中的识别错误的设备和方法可以通过减少语音识别中的错误来提高识别率。
-
64.
公开(公告)号:KR1020040089774A
公开(公告)日:2004-10-22
申请号:KR1020030023563
申请日:2003-04-15
Applicant: 한국전자통신연구원
IPC: G06F17/27
Abstract: PURPOSE: A device and a method for checking spacing/spell using the n-gram of a phonological word are provided to correct an error by forming an n-gram language model for the phonological word, extracting a non-verified phonological word list from a corpus to be verified, and applying grammar rules, morpheme analysis, and proper noun/foreign origin word estimation to the extracted phonological word list. CONSTITUTION: A phonological word n-gram database(S2) stores the phonological word n-gram. An n-gram constructor(10) extracts the phonological word n-gram by receiving language data having no error and stores the extracted phonological word n-gram to the phonological word n-gram database. A phonological word n-gram searching/verifying(20) part changes each phonological word included in the language data to a structure mapping each phonological word to one symbol, and searches that the same phonological word is present by searching the changed phonological word from the phonological word n-gram database. An error/wrong typing correcting part(30) corrects the spacing error and the wrong typing for the phonological word not verified by the phonological word n-gram searching/verifying part.
Abstract translation: 目的:提供使用语音单词的n-gram来检查间隔/拼写的装置和方法,以通过形成用于语音词的n-gram语言模型来纠正错误,从一个非语言单词提取未验证的语音单词列表 验证语料,并将语法规则,语素分析和专有名词/外来来源词估计应用于提取的语音词列表。 构成:语音词n-gram数据库(S2)存储语音词n-gram。 n-gram构造函数(10)通过接收没有错误的语言数据提取语音词n-gram,并将提取的语音词n-gram存储到语音词n-gram数据库。 语音词n-gram搜索/验证(20)部分将包括在语言数据中的每个语音词部分改变为将每个语音词映射到一个符号的结构,并且通过搜索来自所述语音词的改变的语音词来搜索相同的语音单词 语音词n-gram数据库。 错误/错误的打字校正部分(30)纠正由语音词n-gram搜索/验证部分未验证的语音词的间隔错误和错误的输入。
-
公开(公告)号:KR1020040018008A
公开(公告)日:2004-03-02
申请号:KR1020020050296
申请日:2002-08-24
Applicant: 한국전자통신연구원
Inventor: 김정세
IPC: G06F17/28
Abstract: PURPOSE: A device and a method for tagging part-of-speech are provided to apply to a use needing a quick response such as a voice synthesis, and to output a part-of-speech tagging result at high speed. CONSTITUTION: Data storing parts(120,130,150) store a basic dictionary containing a morpheme and the sort information of the morpheme, the part-of-speech connection information, and a trigram value. A morpheme analyzing part(140) divides the sentence into each syllable, checks that the divided syllable and a combination between syllables are existed in the basic dictionary, and finds out/lists a connection list of the morphemes having at least one part-of-speech for the divided syllable and the combination. For an initial syllable in the inputted sentence, a part-of-speech tagging part(160) selects one from the connection lists based on the part-of-speech statistics information and a trigram value by using all analysis results. For a next syllable, the part-of-speech tagging part selects the connection list for the morpheme based on the part-of-speech statistics information and the trigram value for the morpheme of the previous syllable.
Abstract translation: 目的:提供用于标记语音部分的设备和方法以应用于需要诸如语音合成的快速响应的使用,并且以高速输出词性标签结果。 规定:数据存储部分(120,130,150)存储包含语素的基本字典和词素的排序信息,词性连接信息和三角形值。 语素分析部分(140)将句子分成每个音节,检查分词音节和音节之间的组合是否存在于基本词典中,并且发现/列出具有至少一部分词素的语素的连接列表, 语音分为音节和组合。 对于输入句子中的初始音节,词性标注部分(160)通过使用所有分析结果,基于词性统计信息和三元组值从连接列表中选择一个。 对于下一个音节,词性标注部分基于词性统计信息和前一个音节的语素的三角形值来选择语素的连接列表。
-
公开(公告)号:KR1020030008596A
公开(公告)日:2003-01-29
申请号:KR1020010043414
申请日:2001-07-19
Applicant: 한국전자통신연구원
IPC: G10L15/14
Abstract: PURPOSE: A voice recognition system capable of recognizing subjective words and the method thereof are provided to improve the accuracy of the voice recognition by recognizing input sentences by using language models classified by subjective words. CONSTITUTION: A voice recognition system capable of recognizing subjective words includes a first storing part(13) storing general language models composed of a plurality of general language dictionaries; a second storing part(15) storing language models by subjects composed of a plurality of language dictionaries by subjects; a voice analyzing part(3) receiving and analyzing a connecting voice of a speaker; a voice recognizing part(5) recognizing the connecting voice analyzed at the voice analyzing part by using a sound model and a language model; a subject classifying part(9) examining subjective words included in the connecting voice to be classified by subjects; and a language model storing part(11) receiving the language dictionaries by subjects corresponding to the classified subjective words and the general language dictionaries to generate and store a new language model, so that the general words included in the connecting voice are recognized by the general language dictionaries and the subjective words are recognized by the language dictionaries by subjects.
Abstract translation: 目的:提供一种能够识别主观词的语音识别系统及其方法,以通过使用由主观词分类的语言模型识别输入句子来提高语音识别的准确性。 构成:能够识别主观词的语音识别系统包括存储由多个通用语言字典组成的通用语言模型的第一存储部分(13) 第二存储部分(15),通过由主体由多个语言字典组成的对象存储语言模型; 语音分析部(3),接收和分析扬声器的连接声音; 识别通过使用声音模型和语言模型在语音分析部分分析的连接语音的语音识别部分(5); 主题分类部分(9)检查包括在连接语音中的被主体分类的主观词; 以及语言模型存储部分(11),其通过与分类的主观词语和通用语言词典相对应的主题接收语言词典,以生成和存储新的语言模型,使得包括在连接语音中的通用词被一般的 语言字典和主观词被语言词典所认可。
-
-
-
-
-