Abstract:
본 발명은 병렬 코퍼스를 이용하여 기계번역 오류를 자동으로 탐지하는 방법 및 장치에 관한 것이다. 즉, 본 발명에서는 병렬 코퍼스를 이용하여 규칙기반의 기계번역시스템의 오류를 자동으로 탐지하고 추적함에 있어, 기계 번역상 발견된 오류를 병렬 코퍼스의 목적언어 문장 즉, 정답 문장을 이용하여 오류 수정이 가능할 뿐만 아니라, 오류 유형을 분류하여 일정한 빈도수 이상의 오류들을 오류 정보로 제공함으로써, 기계번역상 오류를 탐지하는데 소요되는 시간과 노력을 획기적으로 줄일 수 있으며, 시스템 엔지니어가 탐지, 추적된 오류 정보를 통해 기계번역시스템의 성능을 쉽게 개선할 수 있도록 함으로써, 기계번역시스템의 성능 향상 효율을 극대화할 수 있다. 병렬코퍼스, 형태소, 단어, 오류, 탐지, 번역
Abstract:
PURPOSE: A document translation device and a method thereof are provided to improve the translation selection performance through text analysis and to improve the translation accuracy and readability of English documents. CONSTITUTION: A document processing block(102) performs morpheme analysis/tagging about an inputted English document. The document processing block analyzes statistic information. The document processing block outputs a tagging result in which the text analysis information is reflected. A document translation block(104) performs structure analysis/structure conversion about the tagging result outputted from the document processing block. The document translation block outputs a translated document corresponding to the inputted English document.
Abstract:
A translation error correcting method using error correction patterns in a translation system and an apparatus thereof are provided to improve the translation performance by correcting translation errors in real time. An error correction pattern is constructed through the error correction learning which uses the bilingual corpus including translation correct answer sentences of an object language form for a source language sentence(200). The translation for a specific sentence is performed by using an automatic translator(204). By comparing the translated sentence with the conditional part of the error correction pattern, a translation error is grasped(206). The predicted translation error is corrected and outputted(208,210).
Abstract:
본 발명은 명사가 여러 게 나열되는 복합 명사 내부의 의미 구조 분석을 통해 의미의 왜곡이 없는 문장 형태로 변환하여, 명사가 나열된 형태에서 생략된 문장 성분을 자동으로 복원하여 의미 왜곡이 없는 문장으로 생성하는 문장 성분 복원 장치 및 그 방법에 관한 것이다. 본 발명에 의해, 분석된 복합 명사의 의미 구조를 바탕으로 의미를 왜곡시키지 않으면서, 다른 형태의 표현을 생성할 수 있게 된다.
Abstract:
A method for constructing translation knowledge and an apparatus thereof are provided to minimize time and cost required in obtaining knowledge by automating a whole process of translation knowledge obtaining. A method for constructing translation knowledge comprises the following steps: a step for converting a source language sentence and a target language sentence into a form in which sentence structure information is expressed(S410); a step for encoding a form of the source language and the target language to a native identification number(S420); a step for performing a word arrangement by self-control learning(S430); a step for correcting an arrangement error(S440); a step for performing a sentence structure arrangement with dependency relationship information of the source language and a word arrangement result(S450); and a step for extracting a word/sentence structure knowledge by using a word/sentence structure arrangement result(S460).
Abstract:
본발명은중한자동번역을위한한국어연결어미생성방법및 그장치에관한것으로, 중/한자동번역에서명시적인어휘로절 간논리연결을표현하지않은중국어문장을한국어로번역하는경우에있어서, 번역한한국어의절 간에명시적인논리연결로표현하지못하는문제점을해결하여한국어연결어미로절 간의논리연결을명시적으로표현하여중국어원문의의미를자연스러운한국어문장으로자동번역함으로써중/한자동번역의번역성능을향상시킬수 있다. 또한, 본발명은번역할중국어원문이비명시적인중국어의단문논리연결을가질경우에한국어관점에서명시적인연결어미를생성하여한국어문장을생성함으로써, 중국어원문의원래의미를그대로가지면서높은품질의한국어를생성할수 있다.
Abstract:
본 발명은 구문 분석 방법 및 그 장치에 관한 것으로, 비활성 챠트를 생성할 경우 미리 구축된 제약조건을 매칭시켜 챠트 생성을 방지 혹은 챠트 가중치를 조정하거나 특정 액션을 수행함으로써, 구문 모호성 처리를 용이하게 수행할 수 있다. 또한, 본 발명은 제약조건 규칙을 적용하여 구문 모호성을 해결하도록 함으로써, 기존에서와 같이 증가된 CFG의 조건이 부여됨에 따라 다르게 적용되는 규칙의 증가와 이 규칙간의 우선순위를 조정하는데 어려움이 있었던 문제점을 해결할 수 있다. 구문분석, 챠트 파싱, 제약 조건, 모호성 처리
Abstract:
본 발명은 문서 번역 기법에 관한 것으로, 문서 내 텍스트에 대한 형태소를 분석하여 그에 대응하는 태깅을 수행하며, 태깅된 결과에 대한 텍스트 분석을 수행하고 그 분석 결과를 태깅 정보에 반영하여 출력하면, 출력된 문서에 대한 태깅 결과에 대해 구조 분석을 수행하고, 구조 변환을 수행한 후에, 텍스트 분석 정보를 참조하여 대역어를 선택하고, 형태소 생성을 수행하여 한글 문서에 대응하는 각 형태소를 생성하여 그 번역된 문서를 출력함으로써, 영문 문서를 정확하게 번역하여 그 번역 문서를 출력할 수 있고, 번역 문서에 대한 가독성(readability)을 향상시킬 수 있는 것이다. 문서 번역, 형태소 분석, 태깅 정보, 대역어
Abstract:
PURPOSE: A substitute language specializing device and a method thereof are provided to extract air vocabulary through primitive language corpus and a target language corpus belongings to a target domain and extract substitute language candidate and reflect representative substitute language to substitute dictionary, thereby reducing the cost by manual. CONSTITUTION: A vocabulary arrangement unit(106) extracts co-occurrence vocabulary through primitive language tagged corpus and target language tagged corpus. The vocabulary arrangement unit extracts substitute candidates with mapping of band relation of co-occurrence vocabularies about a substitute dictionary. An error filtering unit(108) determines representative substitute language with filtering of substitute relation error about the extracted substitute candidate. A substitute dictionary reflector(110) reflects the determined representative substitute to the substitute dictionary.
Abstract:
PURPOSE: A compound noun recognition device and a method thereof are provide to generate a unit noun candidate in an input compound noun of a compound noun recognition device and determine a unit noun, thereby improving recognition about the compound noun. CONSTITUTION: A unit noun extractor(102) extracts a unit noun candidate group from an input compound noun. An affix applying unit(104) performs affix processing about a unit noun of the unit noun candidate group. If a descriptive noun exists among the unit nouns, a meaningful analyzing unit(106) determines meaningful information. According to the affix processing and meaning standing information and meaning restriction conditions, a unit noun determination unit(108) determines a unit noun area by weight applying.