-
公开(公告)号:WO2015099418A1
公开(公告)日:2015-07-02
申请号:PCT/KR2014/012741
申请日:2014-12-23
Applicant: 서강대학교 산학협력단 , 강원대학교산학협력단
CPC classification number: G09B19/04
Abstract: 본 발명은 사용자 발화 데이터와 시스템 응답 데이터로 이루어진 채팅 말뭉치 데이터를 학습 데이터로 입력받아 사용자 발화 데이터와 시스템 응답 데이터 사이의 색인정보를 생성하는 학습을 이행하며, 사용자 발화 데이터가 중문인 경우에는 그 중문을 구성하는 단문들 각각에 대해 시스템 응답 데이터와의 상호정보량을 산출하고, 그 상호정보량을 토대로 단문들 중 어느 하나를 선택하여 그 선택된 단문에 대한 데이터와 시스템 응답 데이터로 학습 데이터를 생성하여 재학습을 이행함으로써, 중문에 대해서도 신뢰할 수 있는 시스템 응답 데이터를 제공할 수 있게 한다. 또한 본 발명은 사용자 발화 데이터가 입력되면, 그 사용자 발화 데이터에 대응되는 시스템 응답 데이터를 검출하여 출력하거나, 시스템 응답 데이터가 검출되지 않으며 사용자 발화 데이터가 중문인 경우에는 그 중문을 구성하는 단문들 각각에 대해 대응되는 시스템 응답 데이터들을 검출하고, 그 검출된 시스템 응답 데이터들과 단문 사이의 상호정보량을 산출하고, 그 상호정보량을 토대로 시스템 응답 데이터들 중 어느 하나를 선택하여 출력함으로써, 중문에 대해서도 신뢰할 수 있는 시스템 응답 데이터를 제공할 수 있다.
Abstract translation: 根据本发明,作为学习数据接收包含用户话语数据和系统响应数据的聊天语料库数据; 进行学习以在用户话语数据和系统响应数据之间生成索引信息; 当用户话语数据是复合句时,就构成复合句的每个简单句子计算与系统响应数据有关的互信息量; 基于相互信息量选择简单句子之一; 使用关于所选择的简单句子和系统响应数据的数据生成学习数据; 并进行重新学习,从而提供与复合句相关的可靠的系统响应数据。 此外,根据本发明,当输入用户话语数据时,检测并输出与用户话语数据对应的系统响应数据; 或者当没有检测到系统响应数据,并且当用户话语数据是复合句子时,检测到与构成复合句子的简单句子中的每一个对应的系统响应数据; 计算检测到的系统响应数据和简单句子之间的相互信息量; 并且基于互信息量来选择和输出系统响应数据中的一个,从而提供与复合句相关的可靠的系统响应数据。
-
公开(公告)号:KR101581816B1
公开(公告)日:2016-01-05
申请号:KR1020140138383
申请日:2014-10-14
Applicant: 서강대학교산학협력단 , 강원대학교산학협력단
CPC classification number: G10L15/063 , G10L15/08 , G10L25/27 , G10L2015/0635
Abstract: 본발명에따르는기계학습을이용한음성인식방법은, 음성신호를입력받아음성인식하여다수의후보문장정보및 각후보문장정보에대한순위를포함하는음성인식결과정보를생성하는단계; 상기음성인식결과정보에포함된다수의후보문장정보를미리학습된기계학습모델에따라처리하여상기다수의후보문장정보의순위를가변하여재순위화하는단계; 및재순위화된다수의후보문장정보중 최상위순위의후보문장정보를음성인식결과로선정하는단계;를포함하는것을특징으로한다. 특히, 상기기계학습모델은, 음성신호및 정답문장정보를입력받고, 상기음성신호에대해음성인식하여다수의후보문장정보및 각후보문장정보에대한순위를나타내는문장점수를포함하는음성인식결과정보를생성하고, 상기음성인식결과정보에상기정답문장정보를부가하여정답셋정보를생성하고, 상기정답셋정보에포함된후보문장정보들과정답문장정보의자질정보를추출하여학습데이터를생성하고, 상기학습데이터를토대로하고상기후보문장정보들과정답문장정보의자질정보의차이를토대로후보문장정보의순위를가변하는기계학습을실행하여생성된것임을특징으로한다.
Abstract translation: 根据本发明的使用机器学习的语音识别方法包括以下步骤:通过接收语音信号产生包括多个候选句子和每个候选句子的信息的排名的语音识别结果信息; 通过根据预先学习的机器学习模型,通过处理包括在语音识别结果信息中的多个候选句子的信息来处理关于多个候选句子的信息的排名来重新排序; 并且在重新排列的多个候选句子的信息中选择最高排名的候选句子信息。 特别地,通过接收语音信号和回答句子信息,识别语音信号的语音来产生机器学习模式,以产生包括句子分数的语音识别结果信息,其中参考关于多个候选句子和每个候选句子的信息的排名 将答案语句信息添加到语音识别结果信息中,以生成答案集信息,提取包含在答案集信息中的候选句子和回答句子的信息的特征信息,以产生学习数据,并执行机器 基于学习数据和候选句子信息与答复语句信息之间的特征信息的差异来学习改变候选句子的信息的排名。
-
公开(公告)号:KR1020150075191A
公开(公告)日:2015-07-03
申请号:KR1020130162902
申请日:2013-12-24
Applicant: 서강대학교산학협력단 , 강원대학교산학협력단
Abstract: 본발명은사용자발화데이터와시스템응답데이터로이루어진채팅말뭉치데이터를학습데이터로입력받아사용자발화데이터와시스템응답데이터사이의색인정보를생성하는학습을이행하며, 사용자발화데이터가중문인경우에는그 중문을구성하는단문들각각에대해시스템응답데이터와의상호정보량을산출하고, 그상호정보량을토대로단문들중 어느하나를선택하여그 선택된단문에대한데이터와시스템응답데이터로학습데이터를생성하여재학습을이행함으로써, 중문에대해서도신뢰할수 있는시스템응답데이터를제공할수 있게한다. 또한본 발명은사용자발화데이터가입력되면, 그사용자발화데이터에대응되는시스템응답데이터를검출하여출력하거나, 시스템응답데이터가검출되지않으며사용자발화데이터가중문인경우에는그 중문을구성하는단문들각각에대해대응되는시스템응답데이터들을검출하고, 그검출된시스템응답데이터들과단문사이의상호정보량을산출하고, 그상호정보량을토대로시스템응답데이터들중 어느하나를선택하여출력함으로써, 중문에대해서도신뢰할수 있는시스템응답데이터를제공할수 있다.
Abstract translation: 本发明接收与用户语音数据和系统响应数据形成的聊天语料库数据作为学习数据,执行在用户语音数据和系统响应数据之间生成索引信息的学习,计算每个短句的系统响应数据和互信息量 如果用户语音数据是复合句,则形成复合句,基于相互信息量从短句中选择一个,并且生成具有用于所选择的短句的数据和系统响应数据的学习数据以执行重新学习,从而实现 即使在复合句中也能提供系统响应数据。 此外,如果输入用户语音数据,则本发明检测并提取与用户语音数据对应的系统响应数据,或者如果没有检测到系统响应数据,并且用户语音数据是复合句子,则检测系统 对应于形成复合句的每个短句的响应数据,计算检测到的系统响应数据和短句之间的相互信息量,基于相互信息量从系统响应数据中选择一个,并输出所选择的系统响应数据, 从而为复合句提供系统响应数据的可靠性。
-
公开(公告)号:KR101590908B1
公开(公告)日:2016-02-03
申请号:KR1020130162902
申请日:2013-12-24
Applicant: 서강대학교산학협력단 , 강원대학교산학협력단
CPC classification number: G09B19/04
Abstract: 본발명은사용자발화데이터와시스템응답데이터로이루어진채팅말뭉치데이터를학습데이터로입력받아사용자발화데이터와시스템응답데이터사이의색인정보를생성하는학습을이행하며, 사용자발화데이터가중문인경우에는그 중문을구성하는단문들각각에대해시스템응답데이터와의상호정보량을산출하고, 그상호정보량을토대로단문들중 어느하나를선택하여그 선택된단문에대한데이터와시스템응답데이터로학습데이터를생성하여재학습을이행함으로써, 중문에대해서도신뢰할수 있는시스템응답데이터를제공할수 있게한다. 또한본 발명은사용자발화데이터가입력되면, 그사용자발화데이터에대응되는시스템응답데이터를검출하여출력하거나, 시스템응답데이터가검출되지않으며사용자발화데이터가중문인경우에는그 중문을구성하는단문들각각에대해대응되는시스템응답데이터들을검출하고, 그검출된시스템응답데이터들과단문사이의상호정보량을산출하고, 그상호정보량을토대로시스템응답데이터들중 어느하나를선택하여출력함으로써, 중문에대해서도신뢰할수 있는시스템응답데이터를제공할수 있다.
-
公开(公告)号:KR1020120102260A
公开(公告)日:2012-09-18
申请号:KR1020110020283
申请日:2011-03-08
Applicant: 삼성전자주식회사 , 서강대학교산학협력단
IPC: G06F3/023 , G06F3/0489 , G06F3/0488 , G06F3/01 , G06F1/16
CPC classification number: G06F3/018 , G06F3/0236 , G06F3/0237 , G06F3/04895 , G06F1/1662 , G06F3/04886
Abstract: PURPOSE: A method for preventing an incorrect input in a portable terminal and a device thereof are provided to supply a similar word according to a type of an incorrect input for a keypad, thereby reducing the incorrect input. CONSTITUTION: A controlling unit(15) checks a input string and searches candidate words recommended as a input string among candidate words registered. The controlling unit provides the candidate words searched corresponding to similarity from highest to lowest by calculating the similarity between the input string and the candidate word searched. The controlling unit checks a given code in each key of a checked keypad type, and selects each key as a series of an order for inputting the input string and the candidate words. [Reference numerals] (11) Inputting unit; (12) Outputting unit; (13) Storing unit; (14) Communicating unit; (15) Controlling unit
Abstract translation: 目的:提供一种用于防止便携式终端及其装置中的不正确输入的方法,以根据小键盘的不正确输入的类型提供类似的单词,从而减少不正确的输入。 构成:控制单元(15)检查输入字符串,并且在注册的候选词之间搜索作为输入字符串推荐的候选词。 控制单元通过计算输入字符串和所搜索的候选词之间的相似度,提供对应于从最高到最低的相似度搜索的候选词。 控制单元检查所检查键盘类型的每个键中的给定代码,并且将每个键选择为一系列用于输入输入字符串和候选词的顺序。 (附图标记)(11)输入单元; (12)输出单元; (13)存储单元; (14)沟通单位; (15)控制单元
-
公开(公告)号:KR101753625B1
公开(公告)日:2017-07-20
申请号:KR1020110020283
申请日:2011-03-08
Applicant: 삼성전자주식회사 , 서강대학교산학협력단
IPC: G06F3/023 , G06F3/0489 , G06F3/0488 , G06F3/01 , G06F1/16
CPC classification number: G06F3/018 , G06F3/0236 , G06F3/0237 , G06F3/04895
Abstract: 본발명은휴대용단말기에서오입력을방지하기위한방법을제공하고, 상기방법은입력문자열을확인하고기 등록된후보단어들중 상기입력문자열에추천되는것들을검색하는단계와, 상기입력문자열과검색된각 후보단어간의유사도를산출하는단계및 유사도가높은순으로검색된후보단어들을제시하는단계를포함하는것을특징으로한다.
-
公开(公告)号:KR1020160064335A
公开(公告)日:2016-06-08
申请号:KR1020140167552
申请日:2014-11-27
Applicant: 강원대학교산학협력단
IPC: G06Q50/30
CPC classification number: G06Q50/30
Abstract: 채팅말뭉치구축방법및 채팅말뭉치구축시스템이개시된다. 본발명의일실시예에따른채팅말뭉치구축방법은, 대본말뭉치로부터대사를추출하는단계와, 상기추출된대사를이용하여, 발화-응답관계에따라대화쌍을생성하는단계와, 상기대화쌍에대해, 대화의성립여부에따라태깅하는단계, 및대화가성립되어상기태깅된대화쌍을, 채팅말뭉치로결정하여말뭉치데이터베이스에저장하는단계를포함한다.
Abstract translation: 公开了一种聊天语料库构建方法和聊天语料库构建系统。 根据本发明的实施例的聊天语料库构建方法包括以下步骤:从脚本语料库中提取一行; 使用所提取的线根据话语 - 响应关系生成会话对; 根据会话对是否有效标记对话对; 以及将所述标记的有效会话对确定为聊天语料库,以及将所述标记的有效会话对存储在数据库中。 根据本发明的实施例的聊天语料库构建方法可以减少建立聊天语料库的时间和工作人员的数量,并且确保对话表达的多样性。
-
公开(公告)号:KR1020090106936A
公开(公告)日:2009-10-12
申请号:KR1020080032348
申请日:2008-04-07
Applicant: 삼성전자주식회사 , 강원대학교산학협력단
IPC: G06F17/27
CPC classification number: G06F17/2294 , G06F17/273
Abstract: PURPOSE: A system for spacing a word and a method thereof are provided to be used in a device with low computing power. CONSTITUTION: A system for spacing a word and a method thereof comprise the following steps. Probability value information is generated by applying extracted qualities and probability model to a language corpus written by combining correct answer language corpuses. An error correction rule is generated from a result to which the probability value information is applied. The probability value information and an error correction rule group are successively applied to a sentence(M3) that a user inputs. A user input sentence in which spacing is corrected is outputted.
Abstract translation: 目的:提供一种用于间隔字的系统及其方法,用于具有低计算能力的设备。 构成:用于间隔字的系统及其方法包括以下步骤。 概率值信息是通过将提取的质量和概率模型应用于通过组合正确答案语言语料库编写的语言语料库而生成的。 从应用概率值信息的结果生成纠错规则。 概率值信息和纠错规则组被连续地应用于用户输入的句子(M3)。 输出间隔被校正的用户输入语句。
-
公开(公告)号:KR1020160067469A
公开(公告)日:2016-06-14
申请号:KR1020140172915
申请日:2014-12-04
Applicant: 강원대학교산학협력단
IPC: G06F17/27
CPC classification number: G06F17/27 , G06F17/2705 , G06F17/271 , G06F17/276
Abstract: 개체간 사회관계추출장치및 방법이개시된다. 개체간 사회관계추출장치는제1 문장내 어절을, 지배소와의존소로구분하고, 상기지배소로구분된어절을중앙에두고, 상기중앙의양단으로상기의존소로구분된어절을위치시켜제1 의존트라이그램을생성하는프로세서와, 상기제1 의존트라이그램과, 상기제1 문장과비교대상이되는제2 문장과연관하여생성되는제2 의존트라이그램을비교하여, 상기비교결과에따라, 상기제1 및제2 문장을유사한관계를가진문장으로서선별하는연산부를포함한다.
Abstract translation: 披露区域提取实体之间的社会关系的装置和方法。 用于提取实体之间的社会关系的装置包括处理器和计算单元。 处理器将第一句中的句法单词划分为规则元素和依赖元素,将作为规则元素的句法单词放置在第一句的中心,并将作为依赖元素的句法词放置在中心的两端 创建第一个依赖三元组。 所述计算单元将所述第一依赖性三元组与与第一句子进行比较的第二句子相关的第二依赖性三角形进行比较,并且根据比较结果选择所述第一句和第二句作为具有相似关系的句子。
-
公开(公告)号:KR101496885B1
公开(公告)日:2015-02-27
申请号:KR1020080032348
申请日:2008-04-07
Applicant: 삼성전자주식회사 , 강원대학교산학협력단
IPC: G06F17/27
CPC classification number: G06F17/2294 , G06F17/273
Abstract: 본 발명은 문장의 자동 띄어쓰기 기술에 관한 것으로, 특히 컴퓨팅 파워가 낮은 휴대 단말 기기에서 입력된 문장의 띄어쓰기 부분을 자동으로 인식하여 적용할 수 있는 문장 띄어쓰기 시스템 및 방법에 관한 것이다.
이를 위해 본 발명은 정답 말뭉치로부터 자질별로 확률 값이 설정되는 확률 값 정보를 생성하는 단계와, 상기 확률 값 정보를 실제 적용한 결과물로부터 오류 보정 규칙을 생성하는 단계로 구성되는 학습 과정, 및 사용자가 입력한 문장(이하 사용자 입력 문장)에 상기 확률 값 정보와 상기 오류 보정 규칙 집합을 순차적으로 적용하여 띄어쓰기가 보정된 사용자 입력 문장을 출력하는 적용 과정을 포함하는 문장 띄어쓰기 방법과 그 시스템을 제공한다.
이에, 핸드폰이나 PDA와 같이 일반적인 PC에 비해 컴퓨팅 파워가 떨어지는 휴대 단말기 등에서 효과적으로 작동되는 경량화된 문장 자동 띄어쓰기 시스템 및 방법을 구현할 수 있다
띄어쓰기, n-gram, CRFs, 말뭉치, 휴대 단말기, 확률 모델
-
-
-
-
-
-
-
-
-