Abstract:
본 발명은 인공지능 자연어 처리 기술을 이용한 외국어 회화 연습 방법 및 장치와 이것의 빠른 개발과 검증을 돕는 학습자 시뮬레이션 방법과 장치에 관한 것이다. 본 발명은 PC, PDA, 휴대폰, 인공지능 에이전트 등 모든 컴퓨팅 장치에 탑재하여 외국어 회화 학습에 활용될 수 있다. 본 발명은 외국어 학습자의 자연어 음성입력을 받아서 발화 내용과 오류를 파악하고 오류에 적절한 교정 피드백을 제공하는 동시에 상황에 맞는 원어민식 표현 응답을 생성한다. 생성된 응답은 자연어 음성합성을 이용하여 원어민 수준의 음성으로 학습자에게 전달된다. 본 발명은 다양한 학습자의 다양한 어학수준을 고려하고 대화 문맥을 고려하여 오류를 포함한 학습자의 발화에서도 발화의도를 추출할 수 있고 이 발화 의도를 바탕으로 교정 피드백을 가능하게 하는 다양한 대화 현상을 모델링하는 대화 기술을 사용하여 자연스러운 회화 교육 대화를 제공할 수 있다. 그리고 상기의 기술을 개발하고 검증할 때 다양한 수준의 실제 학습자들을 동원하는 것은 많은 비용과 시간을 요구하는 작업이므로 기술 개발 시간과 비용을 최소화시키기 위해 실제 학습자의 대화 방법, 오류, 수준별 특성 등을 시뮬레이션할 수 있는 기술이 필요하다. 본 발명을 통해 외국어 학습자에게 원어민 교사처럼 외국어로 회화 상대를 하면서 필요한 부분을 교육할 수 있는 지능적인 자연어 처리 외국어 회화 학습 장치를 구현할 수 있다. 외국어, 회화, 연습, 학습자, 시뮬레이션
Abstract:
PURPOSE: A document processing apparatus and a method for extracting expression and description are provided to automatically construct a script document and a description document. CONSTITUTION: A document collection unit(110) collects a document from a website, and separates the document into a script part and a description part. The document collection unit generates a script document and a description document. Based on the description document, an expression extraction unit(150) extracts expression description sentence.
Abstract:
본 발명에 의한 전역 유발 자질을 이용한 통계적 음성 언어 이해 방법은 학습용 데이터를 적용한 이전의 제1 음성 언어 이해기와 새로운 전역 문맥 정보를 추가한 제2 음성 언어 이해기의 성능을 비교 평가하는 정량적 기준에 따라 반복적으로 전역 유발 자질을 추출하여 유발 자질 리스트에 추가하는 과정; 음성 인식 문장에 입력되면 해당 음성 인식 문장에서 국소 문맥 정보와 상기 유발 자질 리스트를 이용하여 전역 문맥 정보를 추출하는 과정; 및 상기 제1 음성 언어 이해기에서 상기 국소 문맥 정보와 전역 문맥 정보를 종합처리하여 의미 부착 문장을 출력함을 특징으로 한다. 본 발명에 의하면 음성 언어 이해의 성능을 향상시키데 필요한 전역 문맥 정보를 추출하기 위해 유발 자질 정보를 자동으로 추출함으로써 구문 분석이나 규칙 작성에 소요되는 노력과 비용을 절감하며 다양한 응용 영역에 쉽게 적용 가능한 확장성을 제공한다.
Abstract:
A home network control system and a method using multimodal conversation interface are provided to offer the status information and control method of the home network using voice conversation interface and gesture interface. A voice recognition/understanding unit(130) recognizes voice from the inputted voice, and converts the acknowledged voice as described above to a meaning structure. A gesture recognition/understanding unit(140) recognizes gesture from the gesture input, and converts the acknowledged gesture into a meaning structure. A multimodal meaning integration unit(150) produces an integrated meaning structure from the meaning structure as described above. A multimodal control command administration unit(160) converts the integrated meaning structure as described above into a control command.
Abstract:
본 발명은 통계적 자동 번역 기술에 기반하여 번역 성능을 높이기 위한 음성 자동 통역 시스템, 및 그에 적용되는 통계적 자동 번역기의 번역 처리 방법 및 훈련 방법에 관한 것이다. 음성 자동 통역 시스템은 크게 음성 인식기, 통계적 자동 번역기, 음성 합성기의 세 부분으로 나눌 수 있으며 본 발명에서 제시하는 기술은 음성 인식기 결과를 통계적 자동 번역기에 전달할 때의 중간 결과 가공 방법 및 그에 따른 통계적 자동 번역기 훈련 방법과 음성 인식기로부터 다수의 후보를 생성하여 번역결과를 토대로 순위를 재정립하는 방법 및 음성 인식기의 언어 모델을 상황별로 나누어 적용하는 방법을 포함한다. 이 기술을 통해 보다 높은 성능을 가진 시스템을 구축할 수 있다. 통계적 자동 번역, 자동 통역, 전처리, 후처리, 기계 번역, 음성 인식, 음성 합성
Abstract:
A method for correcting a recognition error in a speech recognition system is provided to correct errors included in a result of a speech recognizer automatically, and adapt the speech recognizer even to a new speech area easily. A channel model(16) and an N-gram language model(17) are generated by using transcribed sentences of a speech recognition result and a corresponding speech, and then the channel model and the N-gram language model are studied. A plurality of candidate sentences is generated by combining words, which have high possibility to be equal to words of sentences recognized by a speech recognizer and words transcribed by using the studied channel model and N-gram language model. A corresponding candidate sentence is selected, and is constituted of words having the most suitable meaning by comparing words in a semantic-based language model with respective words constituting each of the candidate sentences.
Abstract:
A method and a system for recognizing a biological entity name based on a workbench are provided to reduce expense for constructing a biological document learning corpus and enhance entity name recognition for automatically extracting the biological entity name from a biological document on the basis of the workbench. An entity name recognizer(12) recognizes the biological entity name from the biological document by using a biological entity name recognition model(16). An entity name corrector(14) receives and corrects corrected data if a biological entity name recognition result needs correction. A machine learning part(15) constructs the new biological entity name recognition module by performing machine learning for a corrected result. The biological entity name recognition module is a statistics-based biological entity name recognition model constructed by the machine learning based on the biological document learning corpus. A document receiver(11) receives the biological document and an entity name recognition result output part(13) provides the recognition result to a user. A correction database(18) receives and stores the corrected data if the biological entity name recognition result needs the correction.