Abstract:
A translation error correcting method using error correction patterns in a translation system and an apparatus thereof are provided to improve the translation performance by correcting translation errors in real time. An error correction pattern is constructed through the error correction learning which uses the bilingual corpus including translation correct answer sentences of an object language form for a source language sentence(200). The translation for a specific sentence is performed by using an automatic translator(204). By comparing the translated sentence with the conditional part of the error correction pattern, a translation error is grasped(206). The predicted translation error is corrected and outputted(208,210).
Abstract:
본 발명은 명사가 여러 게 나열되는 복합 명사 내부의 의미 구조 분석을 통해 의미의 왜곡이 없는 문장 형태로 변환하여, 명사가 나열된 형태에서 생략된 문장 성분을 자동으로 복원하여 의미 왜곡이 없는 문장으로 생성하는 문장 성분 복원 장치 및 그 방법에 관한 것이다. 본 발명에 의해, 분석된 복합 명사의 의미 구조를 바탕으로 의미를 왜곡시키지 않으면서, 다른 형태의 표현을 생성할 수 있게 된다.
Abstract:
A method for constructing translation knowledge and an apparatus thereof are provided to minimize time and cost required in obtaining knowledge by automating a whole process of translation knowledge obtaining. A method for constructing translation knowledge comprises the following steps: a step for converting a source language sentence and a target language sentence into a form in which sentence structure information is expressed(S410); a step for encoding a form of the source language and the target language to a native identification number(S420); a step for performing a word arrangement by self-control learning(S430); a step for correcting an arrangement error(S440); a step for performing a sentence structure arrangement with dependency relationship information of the source language and a word arrangement result(S450); and a step for extracting a word/sentence structure knowledge by using a word/sentence structure arrangement result(S460).
Abstract:
본 발명은 기계번역에 이용되는 대역어 자동 선정 방법 및 장치에 관한 것으로서, 구체적으로는 병렬 말뭉치(Bilingual Corpus)를 이용하여 기존의 대역어 사전에 등록되어 있지 않은 신조어(미등록어)에 대한 대역어를 자동으로 선정할 수 있는 방법 및 장치에 관한 것이다. 본 발명은 원시언어 문장 및 이에 대응하는 목표언어 대역문으로 이루어진 병렬 말뭉치를 이용하여 대역어를 자동 선정하는 방법을 제공한다. 상기 방법은, 상기 원시언어 문장에 대한 형태소 분석 및 구조 분석을 수행하여 상기 문장에 포함된 단어들에 대한 품사 정보를 분석하고 상기 단어들간의 문법적 관계를 판단하는 단계와, 상기 원시언어 문장의 단어들중 대역어 사전에 존재하지 않는 미등록어를 추출하는 단계와, 상기 추출된 미등록어와 문법적 관계가 있는 주변 단어를 상기 원시언어 문장으로부터 선별하는 단계와, 상기 목표언어 대역문에서 상기 주변 단어에 대응하는 대역어를 제거한 후에 남은 단어를 상기 미등록어의 대역어로 선정하는 단계를 포함한다. 기계번역, 병렬 말뭉치(bilingual corpus), 대역어
Abstract:
A domain-adaptive portable caption machine translation device using dynamic translation resources and a method thereof are provided to improve translation performance for various specialized fields by automatically recognizing a style/field of caption and dynamically forming an optimal translation module and knowledge suitable for a recognition result. A core word extractor(102) extracts a core word for recognizing a style and a field from a caption sentence of a received broadcasting signal. A style/field recognizer(103) recognizes the style/field of the caption sentence based on the extracted core word and various dictionaries. A dynamic translation knowledge former(104) forms translation knowledge dynamically based on the recognized style/field and loads the formed translation knowledge to a dynamic translation database(206). A dynamic translation module former(105) reforms a translation module dynamically based on the recognized style/field. A morpheme analyzer(106) analyzes morphemes of the caption sentence. A style pattern applier(107) performs translation in a sentence unit by applying a style pattern to the caption sentence. A phrase analyzer(108) analyzes phrases of the caption sentence. A pattern-based translation generator(109) generates a pattern-based translation for the caption sentence based on a phrase analysis result.
Abstract:
A method and a device for restoring an ellipsis component in a Korean sentence are provided to generate a correct English translation and improve quality of a translation system by finding an ellipsis component from the Korean sentence and restoring the ellipsis component based on a heuristic rules or a raw corpus. A paragraph recognizer(310) recognizes a start and finish range of an inputted sentence. A paragraph storing part(320) stores the inputted sentence in a declinable word phrase unit based on a paragraph analyzed result of the inputted sentence. An ellipsis recognizer(330) checks whether the declinable word phrase having the ellipsis component to be restored is found from the current sentence. A declinable word comparator(350) compares similarities between declinable word information stored in the paragraph storing part and the current sentence. An antecedent selector(340) checks antecedent candidates for the ellipsis component, determines priority of the antecedent candidates, and determines an antecedent among the antecedent candidate based on a comparison result.
Abstract:
본 발명은 특허 문서를 번역 대상으로 하여 특허 도메인에 특화된(customized) 번역 지식(translation knowledge)을 추출하고 이렇게 추출된 특화된 지식을 사용하여 특허 문서를 자동 번역하는 방법 및 그 장치에 관한 것으로, 특허 문서로부터 전문용어를 대량으로 추출하고 추출된 전문용어에 대하여 대역어를 할당하며, 일반 도메인의 문서가 아닌 특허 문서에서 고빈도로 사용되는 표현들을 추출하고 해당 표현들에 대한 대역 표현을 구축하며, 이렇게 구축된 번역 지식을 사용하고, 또한 특허문서에서의 과대하게 긴 문장들에 대해 문형패턴 적용, 병렬구조 인식 및 구문단서에 의한 문장분할 등을 수행하여, 파싱 가능한 번역 단위를 추출하여 구조분석을 수행하는 특허 문서를 자동으로 번역하는 장치 및 방법을 제공하는데 있다. 기계번역, 자동번역, 지식추출, 특허번역
Abstract:
A device and a method for constructing a dictionary of unknown single noun terms for translating a patent document are provided to efficiently construct a single noun term database to select translation of a specialized term frequently appeared in a Hangul patent document. A morpheme(100) analyzer obtains a morpheme analysis result of a sentence of the inputted Hangul patent document. A specialized term selector(110) extracts a compound noun comprising a noun array from the result as a candidate specialized term and selects a single noun analyzed as an unknown noun among the noun array as a target. A single noun translation selector(120) finds single noun translation information required for selecting the translation by removing an unnecessary part. A candidate translation selection probability determiner(130) determines presence of the translation remaining after deletion of the single noun translation selector. A translation presenter(140) presents the automatically determined translation if the remaining translation is present. An example presenter(170) outputs an example if the remaining translation is not present.
Abstract:
본 발명에 의한 명사 의미 코드 부착 방법 및 그 장치에 의하면, 영한 자동 번역 방법에 있어서, 사전에 등재할 명사 표현에 대역어를 부착하는 단계; 상기 대역어가 부착된 명사 표현에서 핵심 명사를 추출하는 단계; 및 상기 명사 표현에 의미코드를 부착하는 단계;를 포함하는 것을 특징으로 하며, 자동번역 시스템에서 명사 의미코드 부착 방식을 수동 부착 방식에서 반자동 부착방식으로 전환시킴으로서, 명사에 의미코드를 부착하는 시간을 단축할 수 있으며, 명사에 의미코드가 일관성 있게 부착될 수 있고, 명사 의미코드가 부착됨으로 번역 정확도가 향상되며, 동사 대역어 선택시에 명사의 의미코드를 논항으로 사용함으로써 동사 대역어 선택의 커버리지를 향상시킬 수 있는 효과가 있다. 영한 자동번역, 명사 의미코드 부착