Abstract:
본 발명은 문법 오류 정정 시스템 및 이를 이용한 문법 오류 정정 방법에 관한 것으로서, 구체적으로 문법 오류 정정 시스템은 복수의 말뭉치로부터 언어 특성에 따른 복수의 문맥 자질을 취득하고 상기 문맥 자질로부터 문법 오류를 진단하는 기준인 1차 학습 분류 모델 및 2차 학습 분류 모델을 생성하는 학습부, 및 상기 1차 학습 분류 모델을 이용하여 학습자가 입력한 말뭉치에 대해 문법 오류를 예측하고, 상기 문법 오류의 1차 예측 결과와 상기 2차 학습 분류 모델을 이용하여 문법 오류를 예측하고 문법 오류를 정정하는 실행부를 포함하고, 상기 2차 학습 분류 모델은 상기 1차 예측 결과를 바탕으로 복수의 말뭉치로부터 추출된 상기 복수의 문맥 자질을 이용하여 반복적인 학습 기법을 통해 생성되는 것을 특징으로 한다.
Abstract:
본 발명은 표현 및 설명 추출을 위한 문서 처리 장치 및 방법에 관한 것으로서, 이 장치는, 웹으로부터 문서를 수집하고 이를 스크립트 부분과 설명 부분으로 분리하여 스크립트 문서 및 설명 문서를 생성하는 문서 수집부, 그리고 설명 문서에 기초하여 표현 설명 문장을 추출하고 표현 설명 문장이 스크립트 문서 내에서 설명하고 있는 표현을 추출하는 표현 추출부를 포함한다. 본 발명에 의하면, 학습 표현과 이에 대한 설명 부분이 하나의 쌍으로 이루어진 학습 자료를 자동으로 구축할 수 있다.
Abstract:
The present invention relates to a system for correcting grammatical errors and a method for correcting grammatical errors using the same. More particularly, the system for correcting grammatical errors comprises: a learning unit for acquiring a plurality of contextual qualities according to language characteristics from a plurality of corpuses and generating a first learning classification model and a second learning classification model which are standards for diagnosing grammatical errors from the contextual qualities; and an execution unit for predicting grammatical errors for a corpus inputted by a learner using the first learning classification model, predicting grammatical errors using a first prediction result of the grammatical errors and the second learning classification model, and correcting the grammatical errors, wherein the second learning classification model is generated by a repeated learning technique using the contextual qualities extracted from the corpuses, based on the first prediction result. [Reference numerals] (10) Learning unit; (101) Contextual quality extraction unit; (102) Basic classification learning unit; (103) Basic classification model; (104) Basic classification prediction unit; (105) Meta classification learning unit; (106) Meta classification model; (107) Meta classification prediction unit; (20) Modeling unit; (30) Performing unit; (AA,BB) Training corpus; (CC) Learner sentence(input); (DD) System correction(output)
Abstract:
어학 학습 장치 및 어학 학습 방법이 개시된다. 어학 학습 장치는 음성 입력을 단어 단위로 인식하여 전사한 제1 전사자료를 생성하는 제1 음성 인식부와, 제1 전사자료에 기초하여 음성 입력을 음소 단위로 인식하여 전사한 제2 전사자료를 생성하는 제2 음성 인식부와, 제1 전사자료를 미리 정의된 표준발음으로 변환하여 제3 전사자료를 생성하는 표준발음 생성부와, 제2 및 제3 전사자료를 비교하여 미리 설정된 기준에 충족하지 않는 제2 전사자료의 부분에 대한 오류정보를 생성하는 오류 검출부와, 오류정보에 상응하는 피드백정보를 생성하는 피드백 생성부를 포함하여 구성된다. 따라서, 사용자의 학습 자유도를 향상시킬 수 있고, 이로 인하여 사용자는 실제 대화와 유사한 환경에서의 다양한 발화 내용을 연습하고 이에 대한 평가를 받을 수 있다.
Abstract:
PURPOSE: A corpus generator for practicing phrase break prediction, and a method thereof are provided to minimize the reflection of each transcriber`s characteristic, thereby maximizing the reflection of the general transcribers` characteristics of the predicted phrase break. CONSTITUTION: A corpus generator(100) for practicing phrase break prediction comprises: A boundary extractor(110), a boundary determiner(120), and a phrase break prediction corpus generator(130). The boundary extractor receives multiple transcription data transcribed after phrase boundaries about the same text from each of the multiple labeled transcribers and extracts phrase boundaries from each of the multiple transcription data. The boundary determiner compares each of the extracted phrase boundaries, and determines phrase boundaries satisfied with a fixed setting to a phrase break prediction. The phrase break prediction corpus generator labels the determined phrase break prediction, and generates the phrase break prediction corpus. [Reference numerals] (1000) Phrase break prediction corpus DB; (110) Boundary extractor; (120) Boundary determiner; (121) First determination module; (122) Second determination module; (130) Phrase break prediction corpus generator; (AA) Transfer data
Abstract:
PURPOSE: A document processing apparatus and a method for extracting expression and description are provided to automatically construct a script document and a description document. CONSTITUTION: A document collection unit(110) collects a document from a website, and separates the document into a script part and a description part. The document collection unit generates a script document and a description document. Based on the description document, an expression extraction unit(150) extracts expression description sentence.
Abstract:
본 발명은 통계적 자동 번역 기술에 기반하여 번역 성능을 높이기 위한 음성 자동 통역 시스템, 및 그에 적용되는 통계적 자동 번역기의 번역 처리 방법 및 훈련 방법에 관한 것이다. 음성 자동 통역 시스템은 크게 음성 인식기, 통계적 자동 번역기, 음성 합성기의 세 부분으로 나눌 수 있으며 본 발명에서 제시하는 기술은 음성 인식기 결과를 통계적 자동 번역기에 전달할 때의 중간 결과 가공 방법 및 그에 따른 통계적 자동 번역기 훈련 방법과 음성 인식기로부터 다수의 후보를 생성하여 번역결과를 토대로 순위를 재정립하는 방법 및 음성 인식기의 언어 모델을 상황별로 나누어 적용하는 방법을 포함한다. 이 기술을 통해 보다 높은 성능을 가진 시스템을 구축할 수 있다. 통계적 자동 번역, 자동 통역, 전처리, 후처리, 기계 번역, 음성 인식, 음성 합성
Abstract:
PURPOSE: An apparatus for learning language and a method thereof are provided to offer feedback for voice input to a user by analyzing the voice input. CONSTITUTION: A first voice recognition part(110) generates a first transcribed material transcribing voice input by recognizing the voice input in a word unit. A second voice recognition part(120) generates a second transcribed material transcribing the voice input by recognizing the voice input in a phoneme unit. A standard pronunciation generation part(130) generates a third transcribed material by converting the first transcribed material into predefined standard pronunciation. An error detection part(140) generates error information for the part of the second transcribed material not satisfying a predetermined reference by comparing the second transcribed material with the third transcribed material. A feedback generation part(150) generates feedback information corresponding to the error information. [Reference numerals] (1000) Pronunciation data DB; (110) First voice recognition part; (120) Second voice recognition part; (130) Standard pronunciation generation part; (140) Error detection part; (150) Feedback generation part; (160) Expansion pronunciation generation part; (2000) Pronunciation dictionary DB; (3000) Feedback DB; (AA) Voice input