-
公开(公告)号:KR101892734B1
公开(公告)日:2018-08-28
申请号:KR1020130001202
申请日:2013-01-04
Applicant: 한국전자통신연구원
CPC classification number: G10L15/01 , G10L2015/225
Abstract: 본발명의음성인식시스템에서의오류수정방법은, 음향모델기반의음성인식오류-정답쌍 DB를이용하여음성인식오류에대한제 1 정답후보군을탐색하는과정과, 단어관계정보 DB를이용하여상기음성인식오류에대한제 2 정답후보군을탐색하는과정과, 사용자오류수정정보 DB를이용하여상기음성인식오류에대한제 3 정답후보군을탐색하는과정과, 도메인발화패턴 DB 및고유명사 DB를이용하여상기음성인식오류에대한제 4 정답후보군을탐색하는과정과, 탐색된각 정답후보군내 정답후보들을정렬시켜표시하는과정을포함할수 있다.
-
公开(公告)号:KR101763329B1
公开(公告)日:2017-08-14
申请号:KR1020150027285
申请日:2015-02-26
Applicant: 한국전자통신연구원
Abstract: 본발명은서로다른언어를사용하는사람들간의의사소통을위한자동통역과정에서, 음성인식및 자동번역텍스트를분석하여텍스트를구성하는모든음절의다중조합을기반으로단문이나복합의미를갖는장문의문형을자동분류하고문형부호를부가하는음절다중조합키워드기반문형자동분류방법에관한것으로, 상기방법은, 복수의학습코퍼스를대상으로학습코퍼스별로문형별 키워드후보를추출하는단계; 추출된각각의키워드후보의상대빈도율을계산하는단계; 상기계산된상대빈도율과기 설정된임계값을비교하여그 결과에따라문형별키워드로선별하는단계; 기설정된기준음절수에따라입력되는문장에대한각각의음절을다중조합하는단계 ; 및상기조합된음절과상기선별한문형별키워드를비교하여해당문장의문형을분류하고분류된문형에따른문형부호를부가하는단계를포함한다.
Abstract translation: 在本发明的人讲不同的语言之间进行通信的自动判读过程的基础上,所有通过短期或复杂的含义分析语音识别和自动翻译的文字冗长uimunhyeong弥补文字的音节的多重组合 进一步包括:自动分类,并通过加入该组合为基础的多关键字栅形式的自动分类的方法的句子代码音节,该方法包括以下步骤:提取由候选关键词句图案通过学习语料库靶向多个学习语料库; 计算每个提取的关键词候选的相对频率比率; 将计算得到的相对频率与预设门限值进行比较,并根据结果按关键字进行排序; 根据预定数量的参考音节将每个音节相对于句子输入进行复用; 将组合音节与分类汉字类型的关键词进行比较,对句子查询类型进行分类,并根据分类后的类型添加句子码。
-
公开(公告)号:KR101295642B1
公开(公告)日:2013-08-13
申请号:KR1020090120657
申请日:2009-12-07
Applicant: 한국전자통신연구원
Abstract: 본 발명은 음성인식결과 문장에 대한 문형분류장치 및 방법에 관한 것으로, 화자의 발성에 의해 입력된 음성을 인식하고, 음성 인식 결과에 의한 텍스트 문장을 대상으로 형태소를 분석하여, 형태소 분석 결과로부터 해당 문장의 문형을 분류하고, 문형 분류 결과에 따라 해당 문장의 말미에 문장 부호를 추가하는 의미분석모듈을 포함하며, 문장 부호가 추가된 문장을 타겟 언어로 번역하여 그에 대응하는 음성합성음을 출력한다. 본 발명에 따르면, 전체 자동통역 과정 중에서, 음성인식결과 및 이를 입력으로 하는 자동번역에 이르는 과정에서 음성인식결과에 의한 텍스트 문장의 문형을 분류하기 위한 것으로, 음성인식결과의 문형을 식별해 줌으로써, 자동번역 입력문의 문형정보를 보다 정확히 제공하게 되며, 궁극적으로 소스언어를 타겟언어로 자동통역하는 것이 원활히 이루어지게 되는 효과가 있다.
-
公开(公告)号:KR1020130014894A
公开(公告)日:2013-02-12
申请号:KR1020110076621
申请日:2011-08-01
Applicant: 한국전자통신연구원
IPC: G10L15/14
Abstract: PURPOSE: A word meaning recognizing device using engram is provided to recognize words for inputted sentences by setting the meaning information of the words. CONSTITUTION: A meaning information data managing unit(100) divides sentence corpuses according to an engram unit. The meaning information data managing unit generates engram characteristic values. The meaning information data managing unit generates relative characteristic values of the engram unit according to meaning information. A meaning recognizing unit(300) adds a meaning tag to the word of the inputted sentence based on a comparing result between the meaning information and a relative characteristic value. [Reference numerals] (110) Meaning information establishing unit; (120) Data storage unit; (130) Overlapped data removing unit; (140) N-gram information generating unit; (150) N-gram analyzing unit; (200) Sentence input unit; (300) Meaning recognizing unit
Abstract translation: 目的:提供使用engram的识别装置的单词,用于通过设置单词的含义信息来识别输入句子的单词。 构成:意义信息数据管理单元(100)根据枚举单位划分句子语料库。 含义信息数据管理单元生成图形特征值。 意义信息数据管理单元根据含义信息生成图形单元的相对特征值。 意义识别单元(300)基于意义信息和相对特征值之间的比较结果将意义标签添加到输入的句子的单词。 (附图标记)(110)含义信息建立单元; (120)数据存储单元; (130)重叠数据去除单元; (140)N-gram信息生成单元; (150)N-gram分析单元; (200)句子输入单元; (300)含义识别单位
-
公开(公告)号:KR1020110071205A
公开(公告)日:2011-06-29
申请号:KR1020090127709
申请日:2009-12-21
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2854
Abstract: PURPOSE: An automatic interpretation device and method is provided to enhance the interpreting performance by using/calculating the similarity between an interpreted sentence and a first language sentence which is a speech recognition result. CONSTITUTION: A speech recognizer(S100) receives the first language speech and generates the first language sentence with speech recognizing process. A language processor(S110) extracts the element included in the first language sentence. A similarity calculation part(S120) compares the extracted element and the element included in the interpreted sentence, and calculates the similarity between the first language sentence and the interpreted sentence. A sentence translation part(S130) translates the first language sentence into the second language sentence according to the similarity. A speech composing part(S140) extracts/composes the speech data corresponding to the second language sentence and outputs the speech signal.
Abstract translation: 目的:提供一种自动解释装置和方法,通过使用/计算解释语句和作为语音识别结果的第一语言句子之间的相似度来增强解释性能。 构成:语音识别器(S100)接收第一语言语音,并产生具有语音识别处理的第一语言句子。 语言处理器(S110)提取包含在第一语言句子中的元素。 相似度计算部分(S120)比较提取的元素和解释语句中包含的元素,并计算第一语言句和解释句之间的相似度。 句子翻译部分(S130)根据相似度将第一语言句子翻译成第二语言句子。 语音合成部(S140)提取/构成与第二语句对应的语音数据,并输出该语音信号。
-
公开(公告)号:KR1020110057637A
公开(公告)日:2011-06-01
申请号:KR1020090114113
申请日:2009-11-24
Applicant: 한국전자통신연구원
CPC classification number: G06F17/30705 , G06F3/16 , G06F17/27 , G06F17/28
Abstract: PURPOSE: A sentence pattern classification method and keyword extraction method for the same are provided to rapidly classify the sentence pattern of a sentience without a complex operation through simple keyword matching. CONSTITUTION: A sentence pattern of an input sentence is classified by using a keyword in database(S450). The sentence pattern of the sentence is classified by using a sentence end keyword. The sentence pattern of the sentence is classified by using a mid-sentence keyword if the sentence pattern is not classified based on the sentence end keyword.
Abstract translation: 目的:提供一种句型分类方法和关键词提取方法,通过简单的关键词匹配快速分类无意义的句子模式,无需复杂的操作。 构成:使用数据库中的关键词对输入句子的句型进行分类(S450)。 通过使用句子结束关键字对句子的句型进行分类。 如果句子模式不是根据句子结束关键字分类,则使用中间句子关键字对句子的句子模式进行分类。
-
7.
公开(公告)号:KR1020110024075A
公开(公告)日:2011-03-09
申请号:KR1020090081936
申请日:2009-09-01
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2755 , G06F17/2785 , G10L15/1815
Abstract: PURPOSE: A pattern database apparatus and method thereof and a voice recognition apparatus are provided to output a corrected voice recognition result by using a pattern-based semantic representation. CONSTITUTION: A pattern database apparatus(100) analyzes syntax after analyzing a morpheme according to a voice recognition result. The pattern database apparatus recognizes and extracts additional information. A volume expression, a meaningless expression, and additional information are changed after performing a class change. A voice recognition result is outputted after producing a sentence.
Abstract translation: 目的:提供一种图案数据库装置及其方法和语音识别装置,以通过使用基于模式的语义表示来输出校正的语音识别结果。 构成:模式数据库装置(100)根据语音识别结果分析语素后分析语法。 模式数据库装置识别并提取附加信息。 执行类更改后,更改卷表达式,无意义表达式和附加信息。 语音识别结果在产生句子后输出。
-
公开(公告)号:KR1020100066978A
公开(公告)日:2010-06-18
申请号:KR1020080125524
申请日:2008-12-10
Applicant: 한국전자통신연구원
IPC: G10L15/183 , G06F17/28
CPC classification number: G10L15/1815 , G10L15/183
Abstract: PURPOSE: A method and a device for voice recognition using domain ontology are provided to build a domain ontology of voice recognition target and generate voice recognition grammar applying the built domain ontology and recognize voice through the voice recognition grammar, thereby improving performance of voice recognition device. CONSTITUTION: If a voice signal is inputted through a mike, a feature extraction unit extracts specific vector of a frame unit from the voice signal(S401). A sound model unit provides voice model to a voice recognition unit through modeling the signal characteristic of the voice signal(S403). The voice recognition unit performs voice recognition through a voice model, a voice recognition dictionary(S405), and voice recognition grammar(S407)(S409).
Abstract translation: 目的:提供一种使用域本体进行语音识别的方法和装置,构建语音识别目标的领域本体,并通过语音识别语法生成应用建立的域本体并识别语音的语音识别语法,从而提高语音识别设备的性能 。 构成:如果通过麦克风输入语音信号,则特征提取单元从语音信号中提取帧单位的特定向量(S401)。 声音模型单元通过对语音信号的信号特征进行建模来向语音识别单元提供语音模型(S403)。 语音识别单元通过语音模型,语音识别字典(S405)和语音识别语法(S407)进行语音识别(S409)。
-
公开(公告)号:KR100792208B1
公开(公告)日:2008-01-08
申请号:KR1020060060365
申请日:2006-06-30
Applicant: 한국전자통신연구원
Abstract: 본 발명은 영역별 설명문 파일 정보 데이터베이스를 구축하고, 상기 사용자 질의에 대한 답변 정보가 사용자 정보 데이터베이스에 존재하지 않은 경우, 정보 검색 서버에 접속하여 정보 검색 요청 메시지를 전송하고, 상기 정보 검색 서버로부터 수신된 검색 결과가 명사형인 경우, 상기 검색 결과에 포함된 어휘를 통합된 어휘로 만들어 상기 영역별 설명문 파일 정보 데이터베이스에 존재하는지를 판단하고, 상기 판단결과 상기 통합된 어휘가 상기 영역별 설명문 파일 정보 데이터베이스에 존재하지 않으면, 상기 통합된 어휘를 띄어쓰기를 기준으로 한 어휘로 분리하고, 상기 분리된 각 어휘가 상기 영역별 설명문 파일 정보 데이터베이스에 존재하는지를 판단하고, 상기 판단결과 각 어휘가 상기 영역별 설명문 파일 정보 데이터베이스에 존재하면, 상기 각 어휘에 해당하는 설명문을 이용하여 답변 문장을 생성하는 것으로서, 웹사이트를 통하여 검색된 검색결과를 사용자에게 제공할 때, 검색 결과 그대로 사용자에게 답변하기보다는 사용자가 듣기에 자연스러운 표현으로 수정하여 답변 문장을 제공할 수 있다.
음성대화시스템, 답변문장, 정보검색-
10.
公开(公告)号:KR101449551B1
公开(公告)日:2014-10-14
申请号:KR1020110106952
申请日:2011-10-19
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2827 , G06F17/30684
Abstract: 통상적인 유사문장 검색 기술은, 입력부, 유사도 계산부, 출력부 등으로 구성되며, 유사도 계산부의 결과인 문장 유사도 확률값이 동일하게 발생될 수 있다. 유사도 계산 결과가 입력문장과 완전히 일치하는 경우에는 1순위로 순위를 조정하면 되지만, 완전히 일치하지 않을 경우에는 동일한 확률값을 가진 문장들 중에서 어느 것을 상위로 결정하느냐에 대한 문제가 발생한다. 이를 위해 다양한 확률값을 활용한 유사문장 검색의 순위 재조정 기법이 있으나, 번역된 제2 언어에 대한 순위 재조정 기법은 전무한 실정이다. 이에 본 발명의 실시예에서는, 문장간 유사도 측정시 검색된 문장들의 순위를 재조정하여 입력문장과 유사가 높은 최적의 문장을 제공함으로써 유사 문장검색 기술 성능을 향상시킬 수 있는 유사문장 검색 기술을 제안하고자 한다.
-
-
-
-
-
-
-
-
-