Abstract:
PURPOSE: A foreign language learning game system and method are provided to inspire the interest of a user and to enhance a learning effect. CONSTITUTION: A foreign language learning game system comprises a conversation system(110), a game system(120), and a data base system(130). The game system advances a game based on a user speech. The conversation system analyzes the user speech which is inputted for game progress and grasps the intention of the user speech. The data base system stores various information which are necessary for an operation of the foreign language learning game and is provided according to the request of the conversation system and the game system.
Abstract:
본 발명은 무제한 단어 환경에서 오디오 및 비디오의 음성 데이터 검색 방법 및 장치에 관한 것으로, 크게 색인부와 검색부로 구성되어 있다. 색인부는 오디오 및 비디오로부터 음성 데이터를 추출하는 음성 데이터 추출기; 음성 데이터를 음성 인식기에서 수행하기 위해 문장 단위로 추정되는 적당한 분량으로 분할하여 웨이브 파일 형태로 저장하는 음성 데이터 분할기; 음성 웨이브 파일을 입력으로 받아 텍스트 데이터 파일 형태로 출력해주는 음성 인식기; 음성 인식의 결과로 나온 격자 형태의 정보를 이용하여 다양한 단위로 색인 테이블을 생성하는 색인기를 포함한다. 검색부는 사용자의 질의를 음성 인식에서의 미등록어 여부를 고려하여 색인 테이블을 활용하도록 여러 가지 가능한 질의들로 확장해주는 질의 확장기; 확장된 질의로부터 색인 테이블을 이용하여 검색을 수행하는 검색기; 검색된 결과를 사용자에게 효과적으로 표시해주는 결과 출력기를 포함한다. 음성 검색, 비디오 검색, 무제한 단어, 미등록어
Abstract:
PURPOSE: A foreign language studying apparatus and a providing method thereof are provided to supply a response to a learner by grasping the talk of the learner according to the meaning of a dialogue and a language property. CONSTITUTION: A voice recognizer(10) recognizes the spoken language of a user and converts the spoken language of the user into a talk text. A talk intension recognizer extracts the talk intension of the user from the talk text by using user information and dialogue information. A feedback processor(30) extracts different expressions according to the talk situation of the user and the talk intension of the user and provides right expression to the user from a database if the talk of the user is not right. A dialogue management module(40) generates a response to the talk text according to the dialogue information and the talk intension of the user.
Abstract:
PURPOSE: A data acquisition system and a method thereof are provided to collect user data through a communication interface which is developed based on an initially collected data. CONSTITUTION: A first terminal(10) offers input data of a user(U1) to a second terminal(20). The second terminal outputs various data of the first terminal and text data of a voice recognition error generator(50). A third terminal(40) provides text input data to the voice recognition error generator or a voice composition unit(30). The voice composition part converts the text data of the second and the third terminal into a voice data. The voice recognition error generator offers the error-added text data to the second terminal.
Abstract:
PURPOSE: A user simulation system and a method thereof are provided to evaluate a chatting system in short time by creating various user languages. CONSTITUTION: A user intention generator(112) generates a purpose of a user using a conditional random field model. A surface language generator(114) creates a sentence by the purpose of the user and extracts a speaking sentence from a word string. A user purpose generating unit produces a probability value by the conditional random field model about user purpose candidate sets. The user purpose generating unit creates the purpose of a user by extracting one of the user purpose candidate sets.
Abstract:
PURPOSE: A method of correcting word alignment links to enhance the accuracy of aligning automatic words, and an apparatus using the same are provided to modify and delete a word arrangement link having an error by judging the errors of a word arrangement link and a word based on the distribution of word arrangement link. CONSTITUTION: Word arrangement units(11,12) arranges words in many-to-one or one-to-one word arrangement manner. A refined word aligner(15) tests error possibility through the distribution of the word arrangement links. The refined word aligner modifies and deletes the links, which have an error, in null to collect the arrangement. The error of the word is judges through the application of an alignment ambiguity score generation scheme.
Abstract:
본 발명에 의한 전역 유발 자질을 이용한 통계적 음성 언어 이해 방법은 학습용 데이터를 적용한 이전의 음성 언어 이해기와 새로운 전역 문맥 정보를 추가한 음성 언어 이해기의 성능을 비교 평가하는 정량적 기준에 따라 반복적으로 전역 유발 자질을 추출하여 유발 자질 리스트에 추가하는 과정; 음성 인식 문장에 입력되면 해당 음성 인식 문장에서 국소 문맥 정보와 상기 유발 자질 리스트를 이용하여 전역 문맥 정보를 추출하는 과정; 및 음성 언어 이해기에서 상기 국소 문맥 정보와 전역 문맥 정보를 종합처리하여 의미 부착 문장을 출력함을 특징으로 한다. 본 발명에 의하면 음성 언어 이해의 성능을 향상시키데 필요한 전역 문맥 정보를 추출하기 위해 유발 자질 정보를 자동으로 추출함으로써 구문 분석이나 규칙 작성에 소요되는 노력과 비용을 절감하며 다양한 응용 영역에 쉽게 적용 가능한 확장성을 제공한다.
Abstract:
A method and a device for automatically classifying a document having a plurality of categories based on a plurality of associative classification rules extracted by using an association rule mining technique are provided to increase correctness of document classification by using more information, as a pattern formed by more than two words is used as a feature by using the associative classification rules. A feature word extracting and document indexing unit(120) stores data to a document database(130) by indexing words included in a learning example document set(110). An association rule mining and classifying rule generator(140) mines an association rule between the words and a label of a document by reading data stored in the document database, and stores the association rule to an association classification rule database(150). A rule arranging and branching unit(160) arranges a plurality of stored classification rules, extracts a few of rules having high quality from the arranged rules by a priority branching mode, and stores the extracted rules to a branched classification rule database(170). A category estimator(180) discriminates a category of the new document(190) by applying the rules stored in the branched classification rule database.
Abstract:
본 발명은 생물학 문헌으로부터 생물학적 개체명을 자동으로 인식하기 위한 워크벤치 기반의 생물학적 개체명 인식 방법 및 시스템을 제공한다. 상기 본 발명에 따른 워크벤치 기반의 생물학적 개체명 인식 방법은 생물학적 개체명을 인식하고자 하는 생물학 문서를 수신하는 단계; 생물학적 개체명 인식 모델을 이용하여 상기 수신된 생물학 문서로부터 생물학적 개체명을 인식하는 단계; 상기 생물학적 개체명 인식 결과의 교정이 필요한 경우 교정된 자료를 수신하는 단계; 상기 교정된 자료를 기초로 기계 학습을 하는 단계; 및 상기 기계 학습의 결과를 생물학적 개체명 인식 모델에 적용하는 단계;를 포함한다. 본 발명에 따르면 생물학적 개체명을 통계 기반의 방식을 사용하여 자동적으로 인식하는데 있어서 생물학 문헌 학습 코퍼스(corpus)를 구축하기 위해 필요한 비용을 줄이며, 개체명 인식 성능을 지속적으로 향상시킬 수 있다. 생물학적 개체명, 개체명 인식, 워크벤치