-
公开(公告)号:KR1020110116790A
公开(公告)日:2011-10-26
申请号:KR1020100036402
申请日:2010-04-20
Applicant: 삼성전자주식회사 , 서강대학교산학협력단 , 강원대학교산학협력단
CPC classification number: H04M1/72522 , G06F17/27 , G06F17/2836 , G10L15/18 , H04M2242/12
Abstract: 본 발명은 휴대용 단말기에서 번역 서비스를 제공하기 위한 것으로, 번역 서비스 제공 방법은, 제1언어의 입력 문장이 입력되면, 상기 입력 문장에서 적어도 하나의 개념어를 추출하는 과정과, 구축 데이터에 저장된 후보 문장들 중 적어도 하나의 유사 문장을 선택 및 제시하는 과정과, 상기 적어도 하나의 유사 문장 중 사용자에 의해 선택된 유사 문장에 치환 대상 개념어가 포함된 경우, 상기 치환 대상 개념어의 치환 여부를 문의하는 화면을 표시하는 과정과, 상기 치환 대상 개념어를 상기 입력 문장에 포함된 개념어로 치환하는 과정과, 치환된 개념어를 포함하는 문장을 상기 제2언어로 번역한 변역 문장을 표시하는 과정을 포함한다.
-
公开(公告)号:WO2015099418A1
公开(公告)日:2015-07-02
申请号:PCT/KR2014/012741
申请日:2014-12-23
Applicant: 서강대학교 산학협력단 , 강원대학교산학협력단
CPC classification number: G09B19/04
Abstract: 본 발명은 사용자 발화 데이터와 시스템 응답 데이터로 이루어진 채팅 말뭉치 데이터를 학습 데이터로 입력받아 사용자 발화 데이터와 시스템 응답 데이터 사이의 색인정보를 생성하는 학습을 이행하며, 사용자 발화 데이터가 중문인 경우에는 그 중문을 구성하는 단문들 각각에 대해 시스템 응답 데이터와의 상호정보량을 산출하고, 그 상호정보량을 토대로 단문들 중 어느 하나를 선택하여 그 선택된 단문에 대한 데이터와 시스템 응답 데이터로 학습 데이터를 생성하여 재학습을 이행함으로써, 중문에 대해서도 신뢰할 수 있는 시스템 응답 데이터를 제공할 수 있게 한다. 또한 본 발명은 사용자 발화 데이터가 입력되면, 그 사용자 발화 데이터에 대응되는 시스템 응답 데이터를 검출하여 출력하거나, 시스템 응답 데이터가 검출되지 않으며 사용자 발화 데이터가 중문인 경우에는 그 중문을 구성하는 단문들 각각에 대해 대응되는 시스템 응답 데이터들을 검출하고, 그 검출된 시스템 응답 데이터들과 단문 사이의 상호정보량을 산출하고, 그 상호정보량을 토대로 시스템 응답 데이터들 중 어느 하나를 선택하여 출력함으로써, 중문에 대해서도 신뢰할 수 있는 시스템 응답 데이터를 제공할 수 있다.
Abstract translation: 根据本发明,作为学习数据接收包含用户话语数据和系统响应数据的聊天语料库数据; 进行学习以在用户话语数据和系统响应数据之间生成索引信息; 当用户话语数据是复合句时,就构成复合句的每个简单句子计算与系统响应数据有关的互信息量; 基于相互信息量选择简单句子之一; 使用关于所选择的简单句子和系统响应数据的数据生成学习数据; 并进行重新学习,从而提供与复合句相关的可靠的系统响应数据。 此外,根据本发明,当输入用户话语数据时,检测并输出与用户话语数据对应的系统响应数据; 或者当没有检测到系统响应数据,并且当用户话语数据是复合句子时,检测到与构成复合句子的简单句子中的每一个对应的系统响应数据; 计算检测到的系统响应数据和简单句子之间的相互信息量; 并且基于互信息量来选择和输出系统响应数据中的一个,从而提供与复合句相关的可靠的系统响应数据。
-
公开(公告)号:KR101590908B1
公开(公告)日:2016-02-03
申请号:KR1020130162902
申请日:2013-12-24
Applicant: 서강대학교산학협력단 , 강원대학교산학협력단
CPC classification number: G09B19/04
Abstract: 본발명은사용자발화데이터와시스템응답데이터로이루어진채팅말뭉치데이터를학습데이터로입력받아사용자발화데이터와시스템응답데이터사이의색인정보를생성하는학습을이행하며, 사용자발화데이터가중문인경우에는그 중문을구성하는단문들각각에대해시스템응답데이터와의상호정보량을산출하고, 그상호정보량을토대로단문들중 어느하나를선택하여그 선택된단문에대한데이터와시스템응답데이터로학습데이터를생성하여재학습을이행함으로써, 중문에대해서도신뢰할수 있는시스템응답데이터를제공할수 있게한다. 또한본 발명은사용자발화데이터가입력되면, 그사용자발화데이터에대응되는시스템응답데이터를검출하여출력하거나, 시스템응답데이터가검출되지않으며사용자발화데이터가중문인경우에는그 중문을구성하는단문들각각에대해대응되는시스템응답데이터들을검출하고, 그검출된시스템응답데이터들과단문사이의상호정보량을산출하고, 그상호정보량을토대로시스템응답데이터들중 어느하나를선택하여출력함으로써, 중문에대해서도신뢰할수 있는시스템응답데이터를제공할수 있다.
-
公开(公告)号:KR1020150075191A
公开(公告)日:2015-07-03
申请号:KR1020130162902
申请日:2013-12-24
Applicant: 서강대학교산학협력단 , 강원대학교산학협력단
Abstract: 본발명은사용자발화데이터와시스템응답데이터로이루어진채팅말뭉치데이터를학습데이터로입력받아사용자발화데이터와시스템응답데이터사이의색인정보를생성하는학습을이행하며, 사용자발화데이터가중문인경우에는그 중문을구성하는단문들각각에대해시스템응답데이터와의상호정보량을산출하고, 그상호정보량을토대로단문들중 어느하나를선택하여그 선택된단문에대한데이터와시스템응답데이터로학습데이터를생성하여재학습을이행함으로써, 중문에대해서도신뢰할수 있는시스템응답데이터를제공할수 있게한다. 또한본 발명은사용자발화데이터가입력되면, 그사용자발화데이터에대응되는시스템응답데이터를검출하여출력하거나, 시스템응답데이터가검출되지않으며사용자발화데이터가중문인경우에는그 중문을구성하는단문들각각에대해대응되는시스템응답데이터들을검출하고, 그검출된시스템응답데이터들과단문사이의상호정보량을산출하고, 그상호정보량을토대로시스템응답데이터들중 어느하나를선택하여출력함으로써, 중문에대해서도신뢰할수 있는시스템응답데이터를제공할수 있다.
Abstract translation: 本发明接收与用户语音数据和系统响应数据形成的聊天语料库数据作为学习数据,执行在用户语音数据和系统响应数据之间生成索引信息的学习,计算每个短句的系统响应数据和互信息量 如果用户语音数据是复合句,则形成复合句,基于相互信息量从短句中选择一个,并且生成具有用于所选择的短句的数据和系统响应数据的学习数据以执行重新学习,从而实现 即使在复合句中也能提供系统响应数据。 此外,如果输入用户语音数据,则本发明检测并提取与用户语音数据对应的系统响应数据,或者如果没有检测到系统响应数据,并且用户语音数据是复合句子,则检测系统 对应于形成复合句的每个短句的响应数据,计算检测到的系统响应数据和短句之间的相互信息量,基于相互信息量从系统响应数据中选择一个,并输出所选择的系统响应数据, 从而为复合句提供系统响应数据的可靠性。
-
公开(公告)号:KR101581816B1
公开(公告)日:2016-01-05
申请号:KR1020140138383
申请日:2014-10-14
Applicant: 서강대학교산학협력단 , 강원대학교산학협력단
CPC classification number: G10L15/063 , G10L15/08 , G10L25/27 , G10L2015/0635
Abstract: 본발명에따르는기계학습을이용한음성인식방법은, 음성신호를입력받아음성인식하여다수의후보문장정보및 각후보문장정보에대한순위를포함하는음성인식결과정보를생성하는단계; 상기음성인식결과정보에포함된다수의후보문장정보를미리학습된기계학습모델에따라처리하여상기다수의후보문장정보의순위를가변하여재순위화하는단계; 및재순위화된다수의후보문장정보중 최상위순위의후보문장정보를음성인식결과로선정하는단계;를포함하는것을특징으로한다. 특히, 상기기계학습모델은, 음성신호및 정답문장정보를입력받고, 상기음성신호에대해음성인식하여다수의후보문장정보및 각후보문장정보에대한순위를나타내는문장점수를포함하는음성인식결과정보를생성하고, 상기음성인식결과정보에상기정답문장정보를부가하여정답셋정보를생성하고, 상기정답셋정보에포함된후보문장정보들과정답문장정보의자질정보를추출하여학습데이터를생성하고, 상기학습데이터를토대로하고상기후보문장정보들과정답문장정보의자질정보의차이를토대로후보문장정보의순위를가변하는기계학습을실행하여생성된것임을특징으로한다.
Abstract translation: 根据本发明的使用机器学习的语音识别方法包括以下步骤:通过接收语音信号产生包括多个候选句子和每个候选句子的信息的排名的语音识别结果信息; 通过根据预先学习的机器学习模型,通过处理包括在语音识别结果信息中的多个候选句子的信息来处理关于多个候选句子的信息的排名来重新排序; 并且在重新排列的多个候选句子的信息中选择最高排名的候选句子信息。 特别地,通过接收语音信号和回答句子信息,识别语音信号的语音来产生机器学习模式,以产生包括句子分数的语音识别结果信息,其中参考关于多个候选句子和每个候选句子的信息的排名 将答案语句信息添加到语音识别结果信息中,以生成答案集信息,提取包含在答案集信息中的候选句子和回答句子的信息的特征信息,以产生学习数据,并执行机器 基于学习数据和候选句子信息与答复语句信息之间的特征信息的差异来学习改变候选句子的信息的排名。
-
公开(公告)号:KR1020120102260A
公开(公告)日:2012-09-18
申请号:KR1020110020283
申请日:2011-03-08
Applicant: 삼성전자주식회사 , 서강대학교산학협력단
IPC: G06F3/023 , G06F3/0489 , G06F3/0488 , G06F3/01 , G06F1/16
CPC classification number: G06F3/018 , G06F3/0236 , G06F3/0237 , G06F3/04895 , G06F1/1662 , G06F3/04886
Abstract: PURPOSE: A method for preventing an incorrect input in a portable terminal and a device thereof are provided to supply a similar word according to a type of an incorrect input for a keypad, thereby reducing the incorrect input. CONSTITUTION: A controlling unit(15) checks a input string and searches candidate words recommended as a input string among candidate words registered. The controlling unit provides the candidate words searched corresponding to similarity from highest to lowest by calculating the similarity between the input string and the candidate word searched. The controlling unit checks a given code in each key of a checked keypad type, and selects each key as a series of an order for inputting the input string and the candidate words. [Reference numerals] (11) Inputting unit; (12) Outputting unit; (13) Storing unit; (14) Communicating unit; (15) Controlling unit
Abstract translation: 目的:提供一种用于防止便携式终端及其装置中的不正确输入的方法,以根据小键盘的不正确输入的类型提供类似的单词,从而减少不正确的输入。 构成:控制单元(15)检查输入字符串,并且在注册的候选词之间搜索作为输入字符串推荐的候选词。 控制单元通过计算输入字符串和所搜索的候选词之间的相似度,提供对应于从最高到最低的相似度搜索的候选词。 控制单元检查所检查键盘类型的每个键中的给定代码,并且将每个键选择为一系列用于输入输入字符串和候选词的顺序。 (附图标记)(11)输入单元; (12)输出单元; (13)存储单元; (14)沟通单位; (15)控制单元
-
公开(公告)号:KR101753625B1
公开(公告)日:2017-07-20
申请号:KR1020110020283
申请日:2011-03-08
Applicant: 삼성전자주식회사 , 서강대학교산학협력단
IPC: G06F3/023 , G06F3/0489 , G06F3/0488 , G06F3/01 , G06F1/16
CPC classification number: G06F3/018 , G06F3/0236 , G06F3/0237 , G06F3/04895
Abstract: 본발명은휴대용단말기에서오입력을방지하기위한방법을제공하고, 상기방법은입력문자열을확인하고기 등록된후보단어들중 상기입력문자열에추천되는것들을검색하는단계와, 상기입력문자열과검색된각 후보단어간의유사도를산출하는단계및 유사도가높은순으로검색된후보단어들을제시하는단계를포함하는것을특징으로한다.
-
公开(公告)号:KR101491581B1
公开(公告)日:2015-02-24
申请号:KR1020080032349
申请日:2008-04-07
Applicant: 삼성전자주식회사 , 강원대학교산학협력단
IPC: G06F17/27
CPC classification number: G06F17/273 , G06F17/2735
Abstract: 본 발명은 철자 오류 보정 기술에 관한 것으로, 특히 컴퓨팅 파워가 낮은 휴대 단말기에서 입력된 문장의 철자 오류를 자동으로 인식하여 보정할 수 있는 철자오류 보정 시스템 및 방법에 관한 것이다.
이를 위해 본 발명은 공인된 말뭉치로부터 철자 오류 보정 사전을 구축하고, 철자 오류 보정 사전에 등록된 문자열들 중 확인 대상 문자열을 선정하며, 확인 대상 문자열에 대응하여 문맥 정보를 획득하여 저장하는 학습 과정과, 사용자 입력 문장이 수신되면 철자 오류 보정 사전을 통해 보정 대상 문자열을 추출하고, 보정 대상 문자열이 상기 확인 대상 문자열이면, 대응하는 상기 문맥 정보를 이용하여 사용자 입력 문장을 보정하는 적용 과정을 포함하는 철자 오류 보정 방법과 그 시스템을 제공한다.
이에, 본 핸드폰이나 PDA와 같이 일반적인 PC에 비해 컴퓨팅 파워가 떨어지는 휴대 단말기 등에서 효과적으로 작동되는 경량화된 철자 오류 보정 시스템 및 방법을 구현할 수 있다
철자 오류, 확률 값, 말뭉치, 휴대 단말기, 트라이 구조, 문맥 정보-
公开(公告)号:KR101496885B1
公开(公告)日:2015-02-27
申请号:KR1020080032348
申请日:2008-04-07
Applicant: 삼성전자주식회사 , 강원대학교산학협력단
IPC: G06F17/27
CPC classification number: G06F17/2294 , G06F17/273
Abstract: 본 발명은 문장의 자동 띄어쓰기 기술에 관한 것으로, 특히 컴퓨팅 파워가 낮은 휴대 단말 기기에서 입력된 문장의 띄어쓰기 부분을 자동으로 인식하여 적용할 수 있는 문장 띄어쓰기 시스템 및 방법에 관한 것이다.
이를 위해 본 발명은 정답 말뭉치로부터 자질별로 확률 값이 설정되는 확률 값 정보를 생성하는 단계와, 상기 확률 값 정보를 실제 적용한 결과물로부터 오류 보정 규칙을 생성하는 단계로 구성되는 학습 과정, 및 사용자가 입력한 문장(이하 사용자 입력 문장)에 상기 확률 값 정보와 상기 오류 보정 규칙 집합을 순차적으로 적용하여 띄어쓰기가 보정된 사용자 입력 문장을 출력하는 적용 과정을 포함하는 문장 띄어쓰기 방법과 그 시스템을 제공한다.
이에, 핸드폰이나 PDA와 같이 일반적인 PC에 비해 컴퓨팅 파워가 떨어지는 휴대 단말기 등에서 효과적으로 작동되는 경량화된 문장 자동 띄어쓰기 시스템 및 방법을 구현할 수 있다
띄어쓰기, n-gram, CRFs, 말뭉치, 휴대 단말기, 확률 모델-
公开(公告)号:KR1020090106937A
公开(公告)日:2009-10-12
申请号:KR1020080032349
申请日:2008-04-07
Applicant: 삼성전자주식회사 , 강원대학교산학협력단
IPC: G06F17/27
CPC classification number: G06F17/273 , G06F17/2735
Abstract: PURPOSE: A spelling error correction system and a method thereof are provided to minimize the used amount of a memory and search time by constructing a spelling error correction dictionary in a try type. CONSTITUTION: A spelling error correction method comprises the following steps of: constructing a spelling error correction dictionary(132) based on an authorized language corpus(M1); selecting character strings which can be used differently from a context among character strings registered in the spelling error correction dictionary; obtaining/storing contextual information correspondingly to the selected character strings; and extracting a character string to be corrected through the spelling error correction dictionary when a sentence inputted from a user is received.
Abstract translation: 目的:提供一种拼写错误校正系统及其方法,以通过构建尝试类型的拼写错误校正字典来最小化存储器的使用量和搜索时间。 构成:拼写错误校正方法包括以下步骤:基于授权语言语料库(M1)构建拼写错误校正字典(132); 选择可以与注册在拼写错误校正字典中的字符串之间的上下文不同地使用的字符串; 对应于所选择的字符串获取/存储上下文信息; 并且当从用户输入的句子被接收时,通过拼写错误校正字典提取要校正的字符串。
-
-
-
-
-
-
-
-
-