채팅 데이터 학습 및 서비스 방법 및 그에 따른 시스템
    1.
    发明申请
    채팅 데이터 학습 및 서비스 방법 및 그에 따른 시스템 审中-公开
    数据学习和服务方法及其系统

    公开(公告)号:WO2015099418A1

    公开(公告)日:2015-07-02

    申请号:PCT/KR2014/012741

    申请日:2014-12-23

    CPC classification number: G09B19/04

    Abstract: 본 발명은 사용자 발화 데이터와 시스템 응답 데이터로 이루어진 채팅 말뭉치 데이터를 학습 데이터로 입력받아 사용자 발화 데이터와 시스템 응답 데이터 사이의 색인정보를 생성하는 학습을 이행하며, 사용자 발화 데이터가 중문인 경우에는 그 중문을 구성하는 단문들 각각에 대해 시스템 응답 데이터와의 상호정보량을 산출하고, 그 상호정보량을 토대로 단문들 중 어느 하나를 선택하여 그 선택된 단문에 대한 데이터와 시스템 응답 데이터로 학습 데이터를 생성하여 재학습을 이행함으로써, 중문에 대해서도 신뢰할 수 있는 시스템 응답 데이터를 제공할 수 있게 한다. 또한 본 발명은 사용자 발화 데이터가 입력되면, 그 사용자 발화 데이터에 대응되는 시스템 응답 데이터를 검출하여 출력하거나, 시스템 응답 데이터가 검출되지 않으며 사용자 발화 데이터가 중문인 경우에는 그 중문을 구성하는 단문들 각각에 대해 대응되는 시스템 응답 데이터들을 검출하고, 그 검출된 시스템 응답 데이터들과 단문 사이의 상호정보량을 산출하고, 그 상호정보량을 토대로 시스템 응답 데이터들 중 어느 하나를 선택하여 출력함으로써, 중문에 대해서도 신뢰할 수 있는 시스템 응답 데이터를 제공할 수 있다.

    Abstract translation: 根据本发明,作为学习数据接收包含用户话语数据和系统响应数据的聊天语料库数据; 进行学习以在用户话语数据和系统响应数据之间生成索引信息; 当用户话语数据是复合句时,就构成复合句的每个简单句子计算与系统响应数据有关的互信息量; 基于相互信息量选择简单句子之一; 使用关于所选择的简单句子和系统响应数据的数据生成学习数据; 并进行重新学习,从而提供与复合句相关的可靠的系统响应数据。 此外,根据本发明,当输入用户话语数据时,检测并输出与用户话语数据对应的系统响应数据; 或者当没有检测到系统响应数据,并且当用户话语数据是复合句子时,检测到与构成复合句子的简单句子中的每一个对应的系统响应数据; 计算检测到的系统响应数据和简单句子之间的相互信息量; 并且基于互信息量来选择和输出系统响应数据中的一个,从而提供与复合句相关的可靠的系统响应数据。

    채팅 데이터 학습 및 서비스 방법 및 그에 따른 시스템
    2.
    发明授权
    채팅 데이터 학습 및 서비스 방법 및 그에 따른 시스템 有权
    学习数据的方法及其系统

    公开(公告)号:KR101590908B1

    公开(公告)日:2016-02-03

    申请号:KR1020130162902

    申请日:2013-12-24

    CPC classification number: G09B19/04

    Abstract: 본발명은사용자발화데이터와시스템응답데이터로이루어진채팅말뭉치데이터를학습데이터로입력받아사용자발화데이터와시스템응답데이터사이의색인정보를생성하는학습을이행하며, 사용자발화데이터가중문인경우에는그 중문을구성하는단문들각각에대해시스템응답데이터와의상호정보량을산출하고, 그상호정보량을토대로단문들중 어느하나를선택하여그 선택된단문에대한데이터와시스템응답데이터로학습데이터를생성하여재학습을이행함으로써, 중문에대해서도신뢰할수 있는시스템응답데이터를제공할수 있게한다. 또한본 발명은사용자발화데이터가입력되면, 그사용자발화데이터에대응되는시스템응답데이터를검출하여출력하거나, 시스템응답데이터가검출되지않으며사용자발화데이터가중문인경우에는그 중문을구성하는단문들각각에대해대응되는시스템응답데이터들을검출하고, 그검출된시스템응답데이터들과단문사이의상호정보량을산출하고, 그상호정보량을토대로시스템응답데이터들중 어느하나를선택하여출력함으로써, 중문에대해서도신뢰할수 있는시스템응답데이터를제공할수 있다.

    기계학습을 이용한 음성인식방법
    3.
    发明授权
    기계학습을 이용한 음성인식방법 有权
    使用机器学习的语音识别方法

    公开(公告)号:KR101581816B1

    公开(公告)日:2016-01-05

    申请号:KR1020140138383

    申请日:2014-10-14

    CPC classification number: G10L15/063 G10L15/08 G10L25/27 G10L2015/0635

    Abstract: 본발명에따르는기계학습을이용한음성인식방법은, 음성신호를입력받아음성인식하여다수의후보문장정보및 각후보문장정보에대한순위를포함하는음성인식결과정보를생성하는단계; 상기음성인식결과정보에포함된다수의후보문장정보를미리학습된기계학습모델에따라처리하여상기다수의후보문장정보의순위를가변하여재순위화하는단계; 및재순위화된다수의후보문장정보중 최상위순위의후보문장정보를음성인식결과로선정하는단계;를포함하는것을특징으로한다. 특히, 상기기계학습모델은, 음성신호및 정답문장정보를입력받고, 상기음성신호에대해음성인식하여다수의후보문장정보및 각후보문장정보에대한순위를나타내는문장점수를포함하는음성인식결과정보를생성하고, 상기음성인식결과정보에상기정답문장정보를부가하여정답셋정보를생성하고, 상기정답셋정보에포함된후보문장정보들과정답문장정보의자질정보를추출하여학습데이터를생성하고, 상기학습데이터를토대로하고상기후보문장정보들과정답문장정보의자질정보의차이를토대로후보문장정보의순위를가변하는기계학습을실행하여생성된것임을특징으로한다.

    Abstract translation: 根据本发明的使用机器学习的语音识别方法包括以下步骤:通过接收语音信号产生包括多个候选句子和每个候选句子的信息的排名的语音识别结果信息; 通过根据预先学习的机器学习模型,通过处理包括在语音识别结果信息中的多个候选句子的信息来处理关于多个候选句子的信息的排名来重新排序; 并且在重新排列的多个候选句子的信息中选择最高排名的候选句子信息。 特别地,通过接收语音信号和回答句子信息,识别语音信号的语音来产生机器学习模式,以产生包括句子分数的语音识别结果信息,其中参考关于多个候选句子和每个候选句子的信息的排名 将答案语句信息添加到语音识别结果信息中,以生成答案集信息,提取包含在答案集信息中的候选句子和回答句子的信息的特征信息,以产生学习数据,并执行机器 基于学习数据和候选句子信息与答复语句信息之间的特征信息的差异来学习改变候选句子的信息的排名。

    채팅 데이터 학습 및 서비스 방법 및 그에 따른 시스템
    5.
    发明公开
    채팅 데이터 학습 및 서비스 방법 및 그에 따른 시스템 有权
    学习数据的方法及其系统

    公开(公告)号:KR1020150075191A

    公开(公告)日:2015-07-03

    申请号:KR1020130162902

    申请日:2013-12-24

    CPC classification number: G09B19/04 G06Q50/20 G06Q50/30 G10L15/28

    Abstract: 본발명은사용자발화데이터와시스템응답데이터로이루어진채팅말뭉치데이터를학습데이터로입력받아사용자발화데이터와시스템응답데이터사이의색인정보를생성하는학습을이행하며, 사용자발화데이터가중문인경우에는그 중문을구성하는단문들각각에대해시스템응답데이터와의상호정보량을산출하고, 그상호정보량을토대로단문들중 어느하나를선택하여그 선택된단문에대한데이터와시스템응답데이터로학습데이터를생성하여재학습을이행함으로써, 중문에대해서도신뢰할수 있는시스템응답데이터를제공할수 있게한다. 또한본 발명은사용자발화데이터가입력되면, 그사용자발화데이터에대응되는시스템응답데이터를검출하여출력하거나, 시스템응답데이터가검출되지않으며사용자발화데이터가중문인경우에는그 중문을구성하는단문들각각에대해대응되는시스템응답데이터들을검출하고, 그검출된시스템응답데이터들과단문사이의상호정보량을산출하고, 그상호정보량을토대로시스템응답데이터들중 어느하나를선택하여출력함으로써, 중문에대해서도신뢰할수 있는시스템응답데이터를제공할수 있다.

    Abstract translation: 本发明接收与用户语音数据和系统响应数据形成的聊天语料库数据作为学习数据,执行在用户语音数据和系统响应数据之间生成索引信息的学习,计算每个短句的系统响应数据和互信息量 如果用户语音数据是复合句,则形成复合句,基于相互信息量从短句中选择一个,并且生成具有用于所选择的短句的数据和系统响应数据的学习数据以执行重新学习,从而实现 即使在复合句中也能提供系统响应数据。 此外,如果输入用户语音数据,则本发明检测并提取与用户语音数据对应的系统响应数据,或者如果没有检测到系统响应数据,并且用户语音数据是复合句子,则检测系统 对应于形成复合句的每个短句的响应数据,计算检测到的系统响应数据和短句之间的相互信息量,基于相互信息量从系统响应数据中选择一个,并输出所选择的系统响应数据, 从而为复合句提供系统响应数据的可靠性。

Patent Agency Ranking