Abstract:
본 발명은 자동번역 시스템의 번역 오류를 후처리로 보정하여 번역의 품질을 향상시키는 번역 오류 후처리 보정 기술에 관한 것으로, 목적 언어 코퍼스로부터 번역 오류 유형에 특화된 언어 모델을 구축하고, 오류 특화 언어 모델에 기반하여 번역 오류를 탐색한 후, 오류보정 우선순위 결정 규칙에 따라 탐색된 번역 오류들 간의 오류 보정 우선순위를 정하고, 우선순위에 따라 차례로 탐색된 오류에 대한 보정 후보를 생성하고, 오류 특화 언어모델에 기반한 보정어 선택을 수행한 후, 번역 결과를 수정하는 과정을 반복함으로써 번역문에서 탐색된 모든 오류를 보정하는 것을 특징으로 한다. 본 발명에 의하면, 비문이나 자연스럽지 못한 표현 등과 같은 자동 번역 시스템의 번역 오류를 실시간으로 보정함으로써 자동 번역 시스템의 번역 성능을 향상시킬 수 있다. 자동 번역, 오류 유형 특화 언어 모델, 번역오류 보정
Abstract:
본 발명은 자동 번역 시스템의 도메인 변화에 따른 대역어 사전의 특화 기법에 관한 것으로, 목표 도메인에 속하는 원시 언어 코퍼스와 목표 언어 코퍼스를 이용하여 공기 어휘를 추출하고, 이를 대역어 사전에 매핑시켜 대역어 후보를 추출하며, 이에 대한 대역 관계의 오류를 필터링한 후 대표 대역어를 결정하여 대역어 사전에 반영함으로써, 자동 번역 시스템의 대역어 사전을 자동으로 특화시킬 수 있어 이를 구축하는데 소요되는 비용을 절감할 수 있는 것이다. 자동 번역, 대역어 사전
Abstract:
PURPOSE: A statistical HMM part tagging apparatus and a method thereof for increasing the tagging performance of a morpheme part are provided to increase the accuracy of tagging about a document of a domain by using learning information. CONSTITUTION: A real time learning based statistical part tagging unit(103) utilizes vocabulary stored in a vocabulary probability information DB and context stored in a context probability information DB. A real time learning based tagging error correction unit(105) corrects an error through a tagging error modification DB. A real time document information learning unit(101) establishes real time context probability information DB after extracting context probability information.
Abstract:
PURPOSE: A neologism selection device and a method thereof are provided to determine priority of neologism candidate based on a theme and select neologism according to the priority. CONSTITUTION: A morpheme analyzer(102) performs morphological analysis about input web document. A keyword extractor(106) extracts a keyword corresponding to neologism candidate from analyzed sentence. A subject detecting and tracking unit(108) performs theme detection and theme tracking through the extracted keyword. According to a subject keyword weight of the keyword, a priority determination unit(110) selects neologism according to the priority after determination of priority.
Abstract:
PURPOSE: A method and a device for generating translation sentence in an automatic English-Korean translation system are provided to automatically generate prefinal-ending corresponding to information delivered from Korean to English verb by information which an auxiliary verb or a temporal adverbial phrase transfers to a verb. CONSTITUTION: An English morpheme analyzer(100) analyzes input English sentence in a morpheme unit. A structure analyzer(300) analyzes English structure. English transforming unit(400) changes construction analysis result into Korean structure. A Korean generator(500) generates the Korean structure in the Korean morpheme unit. A perfinal-ending processor(600) transfers Korean perfinal-ending information corresponding to information about the English auxiliary verb group to the Korean generator.
Abstract:
PURPOSE: An apparatus and a method for translation-error post-editing are provided to recognize an error of a final translation version automatically and modify the recognized error. CONSTITUTION: A correction word candidate generator(304) generates an error correction word candidate for estimated translation errors based on the original sentence analysis information of a translation system, and a correction word selector(306) selects the final correction word for the generated error correction word candidate by using an error specialization language model according to an error type. The correction word selector reflects the final correction word to a translation result, and corrects the errors.
Abstract:
본 발명은 번역기에서 사용할 번역 지식을 자동 구축하는 방법 및 장치에 관한 것이다. 본 발명은 소스언어 문장과 상기 소스언어 문장의 번역 문장에 대응하는 타겟언어 문장이 입력되면 상기 소스언어 문장 및 상기 타겟언어 문장의 각 형태소에 품사, 원형, 기본구내에서의 상대적 위치 정보 및 구문 정보를 부착하여 상기 소스언어 문장 및 타겟언어 문장을 변환한 후, 상기 변환한 소스언어 문장과 타겟언어 문장의 단어 정렬과 구문 정렬을 수행하고 상기 단어 정렬 결과와 상기 구문 정렬 결과에서 단어 구문 번역 지식, 이중언어 용언 하위범주 번역 지식 및 이중언어 문형 번역 지식을 추출한다. 대역사전, 단어 정렬, 구문 정렬, 의존관계 분석기, 단어/구문 대역 사전 구축, 이중언어 용언 하위범주 패턴 추출, 이중언어 문형 추출, 이중언어 단어/구문 클러스터