-
公开(公告)号:WO2014115952A1
公开(公告)日:2014-07-31
申请号:PCT/KR2013/009229
申请日:2013-10-16
Applicant: 포항공과대학교 산학협력단
CPC classification number: G10L13/10 , G10L13/027 , G10L13/043 , G10L15/22 , G10L15/26 , G10L25/63 , G10L2015/227
Abstract: 유머 발화를 생성하여 이용하는 음성 대화 시스템 및 방법이 개시된다. 음성 대화 시스템은 사용자 발화를 입력받아 문자 형태로 변환하여 사용자 의도를 분석하는 발화 분석부와, 사용자 의도에 기반하여 사용자 발화에 포함된 핵심어 또는 축약어를 이용하여 유머 발화를 생성하는 유머 발화 생성부와, 사용자 의도에 상응하는 응답으로 채팅 발화를 생성하는 채팅 발화 생성부와, 유머 발화와 채팅 발화로부터 최종 발화를 선택하는 최종 발화 선택부를 포함한다. 따라서, 사용자에게 유머 발화를 제공함으로써 지루함을 덜고 사용자가 채팅 대화 시스템을 사용하면서 재미를 느낄 수 있도록 한다.
Abstract translation: 公开了一种产生和使用幽默语音的语音对话系统和语音对话方法。 语音对话系统包括:语音分析单元,用于通过接收用户语音并将用户语音转换成文本来分析用户的意图; 用于产生幽默语音的幽默语音生成单元,基于用户的意图使用包含在用户语音中的核心单词或缩写词; 聊天语音生成单元,用于生成与用户意图对应的响应的聊天语音; 以及最终语音选择单元,用于从幽默语音和聊天语音中选择最终语音。 因此,本发明可以向用户提供幽默的语音以减轻无聊,并且使用户能够使用聊天对话系统来获得乐趣。
-
公开(公告)号:KR101609422B1
公开(公告)日:2016-04-20
申请号:KR1020130110106
申请日:2013-09-13
Applicant: 포항공과대학교 산학협력단
Abstract: 다수의발화의도예측성능을향상시킬수 있는사용자발화의도추출방법및 사용자발화의도추출방법을수행하는장치가개시된다. 훈련말뭉치로부터문맥자질을추출하는단계와, 추출된문맥자질에대해순차적으로문맥자질을분류하는분류기를학습하여발화의도추출을위한적어도하나의모델을생성하는단계와, 생성된모델을저장하는단계와, 입력된적어도하나의사용자발화로부터적어도하나의문맥자질을추출하는단계와, 추출된적어도하나의문맥자질에대해생성된적어도하나의모델을이용하여사용자발화의도를예측하는단계및 예측된사용자발화의도에기초하여사용자발화의도를추출하는단계를포함한다. 따라서, 발화의도지시자를이용해하나의발화에포함된다수의발화의도를용이하게찾을수 있으며, 발화의도를예측성능을향상시킬수 있다.
-
公开(公告)号:KR101410601B1
公开(公告)日:2014-06-20
申请号:KR1020130008478
申请日:2013-01-25
Applicant: 포항공과대학교 산학협력단
CPC classification number: G10L13/10 , G10L13/027 , G10L13/043 , G10L15/22 , G10L15/26 , G10L25/63 , G10L2015/227
Abstract: Disclosed is a voice dialogue system and method using humor utterance. The voice dialogue system comprises an utterance analyzer for receiving an input of user utterance to be converted to a character format and analyzing the intention of a user; a humor utterance generator for using abbreviations or keywords included in the utterance of the user, based on the intention of the user, to produce humor utterance; a chatting utterance generator for generating a chatting utterance as a response corresponding to the intention of the user; and a final utterance selector for selecting a final utterance from the humor utterance and the chatting utterance. Therefore, the present invention is able to reduce boredom and allow the user to have fun while using the chatting system, by providing humor utterance to the user.
Abstract translation: 公开了一种使用幽默话语的语音对话系统和方法。 语音对话系统包括:话音分析器,用于接收用户话语的输入以转换为字符格式并分析用户的意图; 幽默话语产生器,用于根据用户的意图使用包含在用户话语中的缩写或关键词产生幽默话语; 用于产生与用户意图对应的响应的聊天话语的聊天发声发生器; 以及一个最后的话语选择器,用于从幽默话语和聊天话语中选择最后的话语。 因此,通过向用户提供幽默话语,本发明能够减少无聊,并且允许用户在使用聊天系统时获得乐趣。
-
公开(公告)号:KR101404246B1
公开(公告)日:2014-06-05
申请号:KR1020120120674
申请日:2012-10-29
Applicant: 포항공과대학교 산학협력단
IPC: G10L15/22
Abstract: 본 발명의 실시예에서는 발화 인식 성능 향상 시스템 및 방법을 개시한다. 구체적으로, 언어 단위로 입력된 기존 사용자 발화 문장 및 현재 사용자 발화 문장에 대해 음성 인식 언어 모델인 훈련 말뭉치를 기반으로 가중치를 적용하는 가중치 조정부; 가중치가 적용된 기존 사용자 발화 문장 및 현재 사용자 발화 문장 각각에 대해 N-BEST 및 N-BEST에 대한 점수를 생성하는 인식 N-BEST 생성부; 및 N-BEST에 대해서 기존 사용자 발화 문장 및 현재 사용자 발화 문장의 점수를 합산하는 인식 N-BEST 결합부를 포함하는 발화 인식 성능 향상 시스템을 제공한다. 이에 따라, 오류가 포함된 기존 사용자 발화 문장을 수정하기 위해서, 재발화를 반복할 필요가 없으므로 편리하고 쉽게 사용자 발화 문장을 수정할 수 있는 효과가 있다.
-
公开(公告)号:KR101364774B1
公开(公告)日:2014-02-20
申请号:KR1020120141972
申请日:2012-12-07
Applicant: 포항공과대학교 산학협력단
IPC: G10L15/18
Abstract: Disclosed are a method for correcting the error of speech recognition and an apparatus thereof. The method for correcting the error of speech recognition includes a step of determining the possibility of the error of a speech recognition result, a step of generating a parallel corpus according to the equality of the speech recognition result and a right answer if the possibility of the error is greater than a predetermined standard, and a step of correcting the error of the speech recognition result based on a speech recognition model and a language model. According to the present invention, errors caused by speech recognition can be corrected. [Reference numerals] (AA) Start; (BB) No; (CC) Yes; (DD) End; (S100) Determine the potential error of speech recognition results; (S200) Generate a parallel corpus according to the equality of the speech recognition result and a right answer; (S300) Generate a speech recognition model based on the parallel corpus; (S400) Correct the error of the speech recognition result based on the speech recognition model and a language model
Abstract translation: 公开了一种用于校正语音识别误差的方法及其装置。 用于校正语音识别误差的方法包括确定语音识别结果的错误的可能性的步骤,根据语音识别结果的相等性生成平行语料库的步骤,以及如果可能的话 误差大于预定标准,以及基于语音识别模型和语言模型来校正语音识别结果的误差的步骤。 根据本发明,可以校正由语音识别引起的错误。 (附图标记)(AA)开始; (BB)否 (CC)是; (DD)结束; (S100)确定语音识别结果的潜在误差; (S200)根据语音识别结果的平等和正确答案生成平行语料库; (S300)基于平行语料库生成语音识别模型; (S400)基于语音识别模型和语言模型,校正语音识别结果的误差
-
公开(公告)号:KR101309042B1
公开(公告)日:2013-09-16
申请号:KR1020120102966
申请日:2012-09-17
Applicant: 포항공과대학교 산학협력단
CPC classification number: G10L15/22 , G06F17/3074 , G10L15/02
Abstract: PURPOSE: A multi-domain voice conversation apparatus and a multi-domain voice conversation method using thereof are provided to select the final domain, which is able to generate the optimal system conversation corresponding to the user conversation, thereby implementing natural conversation between the user multi-domain voice conversation apparatuses. CONSTITUTION: A conversation analysis unit (150) extracts the corresponding features from the user conversation. A candidate domain extraction unit (160) calculates suitability of each multi-domain of the user conversation. The candidate domain extraction unit aligns the multi-domain based on the suitability, and extracts the candidate domains. A final domain determiner (170) determines the final domain by the selection of a first candidate domain among the candidate domains. A multi-domain unit (190) enables the final domain to generate the system conversation corresponding to the user conversation. [Reference numerals] (110) User conversation input unit; (130) System conversation output unit; (140) Voice recognition unit; (150) Conversation analysis unit; (151) Linguistic analysis unit; (152) Semantic analysis unit; (153) Keyword analysis unit; (160) Candidate domain extraction unit; (170) Final domain determiner; (180) Record information management unit; (191,BB) Conversation management unit; (192,CC) Response generation unit; (193,DD) Voice synthesizer; (194,FF) Knowledge information unit; (195,EE) Knowledge management unit; (AA) Character string
Abstract translation: 目的:提供一种多域语音会话装置和多域语音对话方法,用于选择最终的域,能够生成对应于用户对话的最佳系统对话,从而实现用户多对多对多语音通话 - 域语音通话设备。 构成:对话分析单元(150)从用户对话中提取相应的特征。 候选域提取单元(160)计算用户会话的每个多域的适用性。 候选域提取单元根据适用性对齐多域,提取候选域。 最终域确定器(170)通过在候选域中选择第一候选域来确定最终域。 多域单元(190)使最终域能够生成对应于用户对话的系统会话。 (附图标记)(110)用户会话输入单元; (130)系统对话输出单元; (140)语音识别单元; (150)对话分析单位; (151)语言分析单位; (152)语义分析单元; (153)关键词分析单位; (160)候选域提取单位; (170)最终决定因子; (180)记录信息管理单位; (191,BB)对话管理单位; (192,CC)响应生成单元; (193,DD)语音合成器; (194,FF)知识信息单位; (195,EE)知识管理单位; (AA)字符串
-
公开(公告)号:KR1020140068760A
公开(公告)日:2014-06-09
申请号:KR1020130142742
申请日:2013-11-22
Applicant: 포항공과대학교 산학협력단
IPC: G06F17/00
Abstract: Disclosed are a dialog management method using memory ability and a device thereof. The dialog management method using the memory ability according to the present invention comprises: a step of receiving an articulation sentence; a step of obtaining a first response by analyzing the intention of the articulation sentence; a step of obtaining a second response by analyzing the unit knowledge of the articulation sentence; and a step of outputting the final response based on the first response and the second response. The present invention is provided to build a dialog management database which reflects the interest and the concern of a conversion partner and to output a proper response for articulation inputted through the database.
Abstract translation: 公开了一种使用记忆能力的对话管理方法及其装置。 根据本发明的使用存储能力的对话管理方法包括:接收发音语句的步骤; 通过分析发音句的意图来获得第一反应的步骤; 通过分析关节语句的单位知识来获得第二响应的步骤; 以及基于第一响应和第二响应输出最终响应的步骤。 提供本发明以构建一个反映转换伙伴的兴趣和关注的对话管理数据库,并输出通过数据库输入的发音的适当响应。
-
公开(公告)号:KR1020150030858A
公开(公告)日:2015-03-23
申请号:KR1020130110106
申请日:2013-09-13
Applicant: 포항공과대학교 산학협력단
CPC classification number: G06F17/2785 , G06F17/278 , G10L15/1815 , G10L15/19
Abstract: 다수의 발화의도 예측 성능을 향상시킬 수 있는 사용자 발화의도 추출 방법 및 사용자 발화의도 추출 방법을 수행하는 장치가 개시된다. 훈련 말뭉치로부터 문맥 자질을 추출하는 단계와, 추출된 문맥 자질에 대해 순차적으로 문맥 자질을 분류하는 분류기를 학습하여 발화의도 추출을 위한 적어도 하나의 모델을 생성하는 단계와, 생성된 모델을 저장하는 단계와, 입력된 적어도 하나의 사용자 발화로부터 적어도 하나의 문맥 자질을 추출하는 단계와, 추출된 적어도 하나의 문맥 자질에 대해 생성된 적어도 하나의 모델을 이용하여 사용자 발화의도를 예측하는 단계 및 예측된 사용자 발화의도에 기초하여 사용자 발화의도를 추출하는 단계를 포함한다. 따라서, 발화의도 지시자를 이용해 하나의 발화에 포함된 다수의 발화의도를 용이하게 찾을 수 있으며, 발화의도를 예측 성능을 향상시킬 수 있다.
Abstract translation: 公开了一种用于提取用户语音意图的方法及其执行该方法的装置,其能够提高多种语音意图的预测性能。 该方法包括以下步骤:从训练语料库中提取上下文属性; 生成用于通过学习用于相对于所提取的上下文属性顺序地分类上下文属性的分类器来提取语音意图的至少一个模型; 存储所生成的至少一个模型; 从至少一个输入用户语音中提取至少一个上下文属性; 使用关于所提取的至少一个上下文属性生成的模型来预测至少一个用户语音意图; 以及基于所述预测的至少一个用户语音意图来提取至少一个用户语音意图。 因此,该方法和装置可以通过使用语音意图指示符来容易地检测包括在语音中的多个语音意图,并且可以提高语音意图的预测性能。
-
公开(公告)号:KR101565658B1
公开(公告)日:2015-11-04
申请号:KR1020130142742
申请日:2013-11-22
Applicant: 포항공과대학교 산학협력단
IPC: G06F17/00
Abstract: 기억능력을이용한대화관리방법및 장치가개시된다. 본발명에따른기억능력을이용한대화관리방법은발화문장을수신하는단계, 수신된발화문장의의도를분석하여제1 응답을획득하는단계, 수신된발화문장의단위지식을분석하여제2 응답을획득하는단계및 상기제1 응답및 제2 응답에기초하여최종응답을출력하는단계를포함한다. 본발명에의하면대화상대의흥미및 관심사를반영하는대화관리데이터베이스를구축하고, 상기데이터베이스를통하여입력되는발화에대한적합한응답을출력가능하다.
-
公开(公告)号:KR1020140054771A
公开(公告)日:2014-05-09
申请号:KR1020120120674
申请日:2012-10-29
Applicant: 포항공과대학교 산학협력단
IPC: G10L15/22
CPC classification number: G10L15/222 , G10L15/01
Abstract: A system and a method for improving an utterance recognition performance are disclosed. Specifically, a system for improving an utterance recognition performance comprises: a weight adjusting unit for applying a weight based on a training corpus which is a voice recognition language model with respect to an existing user utterance sentence and a current user utterance sentence inputted in language; a recognition N-BEST generating unit for generating an N-BEST and an N-BEST score with respect to each of the weighted existing user utterance sentence and the weighted current user utterance sentence; and a recognition N-BEST combining unit for adding up the scores of the existing user utterance sentence and the current user utterance sentence with respect to the N-BEST. Therefore, the user utterance sentence can be corrected conveniently and easily because the user need not repeat re-utterance so as to correct an inaccurate existing user utterance sentence.
Abstract translation: 公开了一种用于提高话语识别性能的系统和方法。 具体地说,一种用于改善话语识别性能的系统包括:权重调节单元,用于基于用语言输入的现有用户话语句和当前用户发话语言的语音识别语言模型的训练语料库应用权重; 识别N-BEST生成单元,用于生成相对于加权的现有用户发言语句和加权的当前用户发言语句中的每一个的N-BEST和N-BEST分数; 以及识别N-BEST组合单元,用于将相对于N-BEST的现有用户话语句和当前用户发声句的分数相加。 因此,用户话语句可以方便和方便地进行修正,因为用户不需要重复重复发音,从而纠正不准确的现有用户发声句。
-
-
-
-
-
-
-
-
-