Abstract:
PURPOSE: An entity name tagging method and a device thereof are provided to improve the performance of a conversation system by tagging an accurate entity name to a word included in a corpus. CONSTITUTION: An acquisition unit(21) acquires an entity name candidate group from a word included in a corpus based on a dictionary for a predetermined domain. A tagging unit(22) tags an entity name to the entity name candidate group by applying an unsupervised learning method including a restriction condition to the entity name candidate group. The acquisition unit acquires the entity name candidate group according to a characteristic in which words included in a corpus are repeated. The restriction condition is a number which indicates the entity name in a sentence in which the words belong to the corpus. [Reference numerals] (21) Acquisition unit; (22) Tagging unit;
Abstract:
PURPOSE: A machine learning method for generating answers and a device thereof are provided to limit the number of answers generated by translation rules depending on accuracy, thereby reducing the complexity of calculation due to the massive generation of the answers. CONSTITUTION: A database(11) stores a standard pronunciation of a corpus and varied pronunciations of the corpus. A maximal cover selection unit(12) selects a maximal cover for the standard pronunciation of a word by extending the context size of the word, which is included in the corpus, and by repeating the process which selects the maximal cover. An initialization rule generation unit(13) generates a context, a maximal cover, and an initialization rule which includes the standard pronunciation of the word. A collection translation rule generation unit(21) generates a collection translation rule based on the initialization rule and the comparison result between the standard pronunciation and the varied pronunciations. [Reference numerals] (11) Database; (12) Maximal cover selection unit; (13) Initialization rule generation unit; (21) Collection translation rule generation unit; (22) Learning translation rule generation unit; (23) Translation rule selection unit;
Abstract:
PURPOSE: An information search method by using the web and a voice conversation method using the method are provided to supply a better search result for a user query by extending knowledge information and information about the user query based on the web. CONSTITUTION: A basic word vector for a user query and a language analysis result is generated to search a vector space database for a vector space corresponding to the basic word vector(S420). Similarity between the basic word vector and the searched vector space are determined(S430). If the similarity is less than standards, an extended word vector is generated from a web search result performed by using the user query and the language analysis result(S440). The vector space database is searched for the vector space corresponding to the extended word vector by using the extended word vector. Knowledge information is searched based on the vector space. [Reference numerals] (1000) Knowledge information DB; (2000) Vector space; (2100) Vector space basic DB; (2200) Vector space extension DB; (AA) No; (BB) Yes; (CC) Search result; (S410) User query and language analysis result; (S420) Basic search; (S430) Determination?; (S440) Extended search; (S450) Generating vector space
Abstract:
PURPOSE: A confirmation enabled probabilistic and example-based spoken dialog system is provided to enable a conversation manager to determine whether information is unclear when a voice error occurs in a voice conversation interface, thereby providing an information confirmation conversation to a user. CONSTITUTION: A conversation state managing unit(112) of a confirmation conversation managing unit(110) calculates reliability of current conversation states using reliability in recognizing a user speech, reliability of understanding voice language, and reliability of a previous conversation state. A confirmation conversation request unit(114) of the confirmation conversation managing unit determines whether information is unclear by a confirmation conversation strategy about the reliability of the current conversation states. [Reference numerals] (10) Voice recognizer; (100) Conversation managing unit; (110) Confirmation Conversation managing unit(probability-based); (112) Conversation state managing unit; (114) Confirmation Conversation request unit; (120) Work related conversation managing unit(example-based); (20) Voice language comprehension unit; (200) Confirmation conversation strategy DB; (300) Conversation example DB
Abstract:
본 발명은 사용자 시뮬레이션 시스템 및 방법에 관한 것으로서, 이 시스템은, 사용자 의도를 생성하는 사용자 의도 생성부, 그리고 상기 사용자 의도에 따라 문장 구조를 생성하고 상기 문장 구조에 대응하는 복수의 단어열을 생성하고 상기 복수의 단어열로부터 발화 문장을 추출하는 표층 언어 생성부를 포함한다. 본 발명에 의하면, 자연스럽고 다양한 사용자 의도를 생성할 수 있으며 생성된 사용자 의도에 적합한 다양한 표층 언어를 생성할 수 있다. 사용자 시뮬레이션, 대화 시스템, 사용자 의도, 표층 언어, CRF 확률 모델
Abstract:
본 발명은 대화 로그를 이용한 학습 기반 대화 시스템 성능 향상 방법 및 그 장치에 관한 것이다. 본 발명에 따른 방법은 사용자와 대화 시스템 사이의 대화 로그를 수집하는 단계, 수집된 대화 로그에서 오류 발화를 추출하여 대화 시스템의 음성 인식 모델을 향상하기 위한 음성 인식 후보군을 생성하는 단계, 수집된 대화 로그에서 오류 발화를 추출하여 대화 시스템의 언어 이해 모델을 향상하기 위한 언어 이해 후보군을 생성하는 단계, 수집된 대화 로그에서 대화 시스템의 대화 패턴에 존재하지 않는 새로운 대화 패턴을 추출하여 대화 시스템의 대화 모델을 향상하기 위한 대화 패턴 후보군을 생성하는 단계, 음성 인식 후보군, 언어 이해 후보군 및 대화 패턴 후보군을 검증하는 단계, 그리고 검증된 후보군을 음성 인식 모델, 언어 이해 모델 및 대화 모델의 향상에 적용하는 단계를 포함한다.
Abstract:
본 발명은 통계적 자동 번역 기술에 관한 것으로, 단어 자동 정렬 링크의 정확도를 높이기 위한 단어 정렬 링크 수정 방법 및 장치에 관한 것이다. 종래의 기술은 병렬 코퍼스의 단어 사이의 통계적 특성만을 이용하여, 의미상 전혀 대응되지 않는 단어들이 서로 정렬되는 경우가 자주 발생한다. 이러한 오류들은 다대다 단어정렬을 생성해낼 때 옳은 정렬 링크를 배제시키는 작용을 하여, 통계적 기계 번역 시스템이 잘못된 번역을 생성하게 하는 원인이 되는데, 본 발명은 이 오류를 감소시켜 기계 번역의 성능을 향상시키는 것을 목적으로 한다. 본 발명에서는 기존의 단어 자동 정렬 방법들이 발생시키는 오류를 감소시키기 위해서, 일대다 정렬 방식과 다대일 단어 정렬 방식의 하나 또는 각각의 단어 정렬 링크(word alignment link)에 대해서 단어 정렬 링크들의 분포를 통해 오류가 있을 가능성을 시험하고, 오류가 있다고 판단할 수 있는 링크들을 널(NULL)로 수정, 즉, 삭제함으로써 다대다 정렬이 옳은 정렬을 포함하도록 한다. 이 방법을 통해 다대다 정렬이 올바른 정렬을 포함하게 됨으로써 최종적으로 생성되는 번역 모델은 좀더 강건해 지고, 이를 통한 기계 번역 결과가 좀더 정확해 지는 효과를 낸다. 기계 번역, 통계적 기계 번역, 단어 정렬, 자동 번역, 자동 통역
Abstract:
PURPOSE: A document processing apparatus and a method thereof are provided to supply new and various example sentences by automatically and continuously collecting the example sentences without a manual work. CONSTITUTION: An example collecting unit(110) collects, from a web, a first example sentence which is written in a first language, and a second example sentence which is the translation of the first example sentence. An example providing unit(170) provides supplies a user with a parallel example including the first and second example sentences. The example providing unit extracts from an input document the expression list used for learning and searches the expression included in the expression list in order to obtain the first example sentence including the expression.