-
公开(公告)号:WO2015099418A1
公开(公告)日:2015-07-02
申请号:PCT/KR2014/012741
申请日:2014-12-23
Applicant: 서강대학교 산학협력단 , 강원대학교산학협력단
CPC classification number: G09B19/04
Abstract: 본 발명은 사용자 발화 데이터와 시스템 응답 데이터로 이루어진 채팅 말뭉치 데이터를 학습 데이터로 입력받아 사용자 발화 데이터와 시스템 응답 데이터 사이의 색인정보를 생성하는 학습을 이행하며, 사용자 발화 데이터가 중문인 경우에는 그 중문을 구성하는 단문들 각각에 대해 시스템 응답 데이터와의 상호정보량을 산출하고, 그 상호정보량을 토대로 단문들 중 어느 하나를 선택하여 그 선택된 단문에 대한 데이터와 시스템 응답 데이터로 학습 데이터를 생성하여 재학습을 이행함으로써, 중문에 대해서도 신뢰할 수 있는 시스템 응답 데이터를 제공할 수 있게 한다. 또한 본 발명은 사용자 발화 데이터가 입력되면, 그 사용자 발화 데이터에 대응되는 시스템 응답 데이터를 검출하여 출력하거나, 시스템 응답 데이터가 검출되지 않으며 사용자 발화 데이터가 중문인 경우에는 그 중문을 구성하는 단문들 각각에 대해 대응되는 시스템 응답 데이터들을 검출하고, 그 검출된 시스템 응답 데이터들과 단문 사이의 상호정보량을 산출하고, 그 상호정보량을 토대로 시스템 응답 데이터들 중 어느 하나를 선택하여 출력함으로써, 중문에 대해서도 신뢰할 수 있는 시스템 응답 데이터를 제공할 수 있다.
Abstract translation: 根据本发明,作为学习数据接收包含用户话语数据和系统响应数据的聊天语料库数据; 进行学习以在用户话语数据和系统响应数据之间生成索引信息; 当用户话语数据是复合句时,就构成复合句的每个简单句子计算与系统响应数据有关的互信息量; 基于相互信息量选择简单句子之一; 使用关于所选择的简单句子和系统响应数据的数据生成学习数据; 并进行重新学习,从而提供与复合句相关的可靠的系统响应数据。 此外,根据本发明,当输入用户话语数据时,检测并输出与用户话语数据对应的系统响应数据; 或者当没有检测到系统响应数据,并且当用户话语数据是复合句子时,检测到与构成复合句子的简单句子中的每一个对应的系统响应数据; 计算检测到的系统响应数据和简单句子之间的相互信息量; 并且基于互信息量来选择和输出系统响应数据中的一个,从而提供与复合句相关的可靠的系统响应数据。
-
公开(公告)号:KR101590908B1
公开(公告)日:2016-02-03
申请号:KR1020130162902
申请日:2013-12-24
Applicant: 서강대학교산학협력단 , 강원대학교산학협력단
CPC classification number: G09B19/04
Abstract: 본발명은사용자발화데이터와시스템응답데이터로이루어진채팅말뭉치데이터를학습데이터로입력받아사용자발화데이터와시스템응답데이터사이의색인정보를생성하는학습을이행하며, 사용자발화데이터가중문인경우에는그 중문을구성하는단문들각각에대해시스템응답데이터와의상호정보량을산출하고, 그상호정보량을토대로단문들중 어느하나를선택하여그 선택된단문에대한데이터와시스템응답데이터로학습데이터를생성하여재학습을이행함으로써, 중문에대해서도신뢰할수 있는시스템응답데이터를제공할수 있게한다. 또한본 발명은사용자발화데이터가입력되면, 그사용자발화데이터에대응되는시스템응답데이터를검출하여출력하거나, 시스템응답데이터가검출되지않으며사용자발화데이터가중문인경우에는그 중문을구성하는단문들각각에대해대응되는시스템응답데이터들을검출하고, 그검출된시스템응답데이터들과단문사이의상호정보량을산출하고, 그상호정보량을토대로시스템응답데이터들중 어느하나를선택하여출력함으로써, 중문에대해서도신뢰할수 있는시스템응답데이터를제공할수 있다.
-
公开(公告)号:KR101581816B1
公开(公告)日:2016-01-05
申请号:KR1020140138383
申请日:2014-10-14
Applicant: 서강대학교산학협력단 , 강원대학교산학협력단
CPC classification number: G10L15/063 , G10L15/08 , G10L25/27 , G10L2015/0635
Abstract: 본발명에따르는기계학습을이용한음성인식방법은, 음성신호를입력받아음성인식하여다수의후보문장정보및 각후보문장정보에대한순위를포함하는음성인식결과정보를생성하는단계; 상기음성인식결과정보에포함된다수의후보문장정보를미리학습된기계학습모델에따라처리하여상기다수의후보문장정보의순위를가변하여재순위화하는단계; 및재순위화된다수의후보문장정보중 최상위순위의후보문장정보를음성인식결과로선정하는단계;를포함하는것을특징으로한다. 특히, 상기기계학습모델은, 음성신호및 정답문장정보를입력받고, 상기음성신호에대해음성인식하여다수의후보문장정보및 각후보문장정보에대한순위를나타내는문장점수를포함하는음성인식결과정보를생성하고, 상기음성인식결과정보에상기정답문장정보를부가하여정답셋정보를생성하고, 상기정답셋정보에포함된후보문장정보들과정답문장정보의자질정보를추출하여학습데이터를생성하고, 상기학습데이터를토대로하고상기후보문장정보들과정답문장정보의자질정보의차이를토대로후보문장정보의순위를가변하는기계학습을실행하여생성된것임을특징으로한다.
Abstract translation: 根据本发明的使用机器学习的语音识别方法包括以下步骤:通过接收语音信号产生包括多个候选句子和每个候选句子的信息的排名的语音识别结果信息; 通过根据预先学习的机器学习模型,通过处理包括在语音识别结果信息中的多个候选句子的信息来处理关于多个候选句子的信息的排名来重新排序; 并且在重新排列的多个候选句子的信息中选择最高排名的候选句子信息。 特别地,通过接收语音信号和回答句子信息,识别语音信号的语音来产生机器学习模式,以产生包括句子分数的语音识别结果信息,其中参考关于多个候选句子和每个候选句子的信息的排名 将答案语句信息添加到语音识别结果信息中,以生成答案集信息,提取包含在答案集信息中的候选句子和回答句子的信息的特征信息,以产生学习数据,并执行机器 基于学习数据和候选句子信息与答复语句信息之间的特征信息的差异来学习改变候选句子的信息的排名。
-
公开(公告)号:KR1020110116790A
公开(公告)日:2011-10-26
申请号:KR1020100036402
申请日:2010-04-20
Applicant: 삼성전자주식회사 , 서강대학교산학협력단 , 강원대학교산학협력단
CPC classification number: H04M1/72522 , G06F17/27 , G06F17/2836 , G10L15/18 , H04M2242/12
Abstract: 본 발명은 휴대용 단말기에서 번역 서비스를 제공하기 위한 것으로, 번역 서비스 제공 방법은, 제1언어의 입력 문장이 입력되면, 상기 입력 문장에서 적어도 하나의 개념어를 추출하는 과정과, 구축 데이터에 저장된 후보 문장들 중 적어도 하나의 유사 문장을 선택 및 제시하는 과정과, 상기 적어도 하나의 유사 문장 중 사용자에 의해 선택된 유사 문장에 치환 대상 개념어가 포함된 경우, 상기 치환 대상 개념어의 치환 여부를 문의하는 화면을 표시하는 과정과, 상기 치환 대상 개념어를 상기 입력 문장에 포함된 개념어로 치환하는 과정과, 치환된 개념어를 포함하는 문장을 상기 제2언어로 번역한 변역 문장을 표시하는 과정을 포함한다.
-
公开(公告)号:KR1020150075191A
公开(公告)日:2015-07-03
申请号:KR1020130162902
申请日:2013-12-24
Applicant: 서강대학교산학협력단 , 강원대학교산학협력단
Abstract: 본발명은사용자발화데이터와시스템응답데이터로이루어진채팅말뭉치데이터를학습데이터로입력받아사용자발화데이터와시스템응답데이터사이의색인정보를생성하는학습을이행하며, 사용자발화데이터가중문인경우에는그 중문을구성하는단문들각각에대해시스템응답데이터와의상호정보량을산출하고, 그상호정보량을토대로단문들중 어느하나를선택하여그 선택된단문에대한데이터와시스템응답데이터로학습데이터를생성하여재학습을이행함으로써, 중문에대해서도신뢰할수 있는시스템응답데이터를제공할수 있게한다. 또한본 발명은사용자발화데이터가입력되면, 그사용자발화데이터에대응되는시스템응답데이터를검출하여출력하거나, 시스템응답데이터가검출되지않으며사용자발화데이터가중문인경우에는그 중문을구성하는단문들각각에대해대응되는시스템응답데이터들을검출하고, 그검출된시스템응답데이터들과단문사이의상호정보량을산출하고, 그상호정보량을토대로시스템응답데이터들중 어느하나를선택하여출력함으로써, 중문에대해서도신뢰할수 있는시스템응답데이터를제공할수 있다.
Abstract translation: 本发明接收与用户语音数据和系统响应数据形成的聊天语料库数据作为学习数据,执行在用户语音数据和系统响应数据之间生成索引信息的学习,计算每个短句的系统响应数据和互信息量 如果用户语音数据是复合句,则形成复合句,基于相互信息量从短句中选择一个,并且生成具有用于所选择的短句的数据和系统响应数据的学习数据以执行重新学习,从而实现 即使在复合句中也能提供系统响应数据。 此外,如果输入用户语音数据,则本发明检测并提取与用户语音数据对应的系统响应数据,或者如果没有检测到系统响应数据,并且用户语音数据是复合句子,则检测系统 对应于形成复合句的每个短句的响应数据,计算检测到的系统响应数据和短句之间的相互信息量,基于相互信息量从系统响应数据中选择一个,并输出所选择的系统响应数据, 从而为复合句提供系统响应数据的可靠性。
-
-
-
-