Abstract:
PURPOSE: A parallel corpus constructing method using a middle language is provided to construct an automatic parallel corpus about a pair of languages having insufficient resources. CONSTITUTION: A first parallel corpus between an middle language and a first language and a second parallel corpus between the middle language and a second language are collected(110). Similarity between a middle language version of the first parallel corpus and a middle language version of the second parallel corpus is analyzed(120). A parallel corpus candidate document of the first language and the second language is extracted based on the analyzed similarity(130).
Abstract:
본발명은중한자동번역을위한한국어연결어미생성방법및 그장치에관한것으로, 중/한자동번역에서명시적인어휘로절 간논리연결을표현하지않은중국어문장을한국어로번역하는경우에있어서, 번역한한국어의절 간에명시적인논리연결로표현하지못하는문제점을해결하여한국어연결어미로절 간의논리연결을명시적으로표현하여중국어원문의의미를자연스러운한국어문장으로자동번역함으로써중/한자동번역의번역성능을향상시킬수 있다. 또한, 본발명은번역할중국어원문이비명시적인중국어의단문논리연결을가질경우에한국어관점에서명시적인연결어미를생성하여한국어문장을생성함으로써, 중국어원문의원래의미를그대로가지면서높은품질의한국어를생성할수 있다.
Abstract:
본 발명은 구문 분석 방법 및 그 장치에 관한 것으로, 비활성 챠트를 생성할 경우 미리 구축된 제약조건을 매칭시켜 챠트 생성을 방지 혹은 챠트 가중치를 조정하거나 특정 액션을 수행함으로써, 구문 모호성 처리를 용이하게 수행할 수 있다. 또한, 본 발명은 제약조건 규칙을 적용하여 구문 모호성을 해결하도록 함으로써, 기존에서와 같이 증가된 CFG의 조건이 부여됨에 따라 다르게 적용되는 규칙의 증가와 이 규칙간의 우선순위를 조정하는데 어려움이 있었던 문제점을 해결할 수 있다. 구문분석, 챠트 파싱, 제약 조건, 모호성 처리
Abstract:
본 발명은 문서 번역 기법에 관한 것으로, 문서 내 텍스트에 대한 형태소를 분석하여 그에 대응하는 태깅을 수행하며, 태깅된 결과에 대한 텍스트 분석을 수행하고 그 분석 결과를 태깅 정보에 반영하여 출력하면, 출력된 문서에 대한 태깅 결과에 대해 구조 분석을 수행하고, 구조 변환을 수행한 후에, 텍스트 분석 정보를 참조하여 대역어를 선택하고, 형태소 생성을 수행하여 한글 문서에 대응하는 각 형태소를 생성하여 그 번역된 문서를 출력함으로써, 영문 문서를 정확하게 번역하여 그 번역 문서를 출력할 수 있고, 번역 문서에 대한 가독성(readability)을 향상시킬 수 있는 것이다. 문서 번역, 형태소 분석, 태깅 정보, 대역어
Abstract:
PURPOSE: A device and a method for verifying translation knowledge which is specialized in a domain are provided to automatically classify translation knowledge which is most adaptive in a corresponding domain by using parallel corpus per domain. CONSTITUTION: A lemma indexer(106) disperse a plurality of lemma indexed parallel corpus to a plurality of cluster servers. Through constructed translation knowledge, a reference translator automatically translates the lemma indexed parallel corpus. Through translation knowledge of a verification target, an evaluation translator(121) automatically translates the lemma indexed parallel corpus. An auto evaluation unit(118) compares a translation performance difference of a reference translation result(116) and an evaluation translation result(123).
Abstract:
PURPOSE: A substitute language specializing device and a method thereof are provided to extract air vocabulary through primitive language corpus and a target language corpus belongings to a target domain and extract substitute language candidate and reflect representative substitute language to substitute dictionary, thereby reducing the cost by manual. CONSTITUTION: A vocabulary arrangement unit(106) extracts co-occurrence vocabulary through primitive language tagged corpus and target language tagged corpus. The vocabulary arrangement unit extracts substitute candidates with mapping of band relation of co-occurrence vocabularies about a substitute dictionary. An error filtering unit(108) determines representative substitute language with filtering of substitute relation error about the extracted substitute candidate. A substitute dictionary reflector(110) reflects the determined representative substitute to the substitute dictionary.
Abstract:
PURPOSE: A compound noun recognition device and a method thereof are provide to generate a unit noun candidate in an input compound noun of a compound noun recognition device and determine a unit noun, thereby improving recognition about the compound noun. CONSTITUTION: A unit noun extractor(102) extracts a unit noun candidate group from an input compound noun. An affix applying unit(104) performs affix processing about a unit noun of the unit noun candidate group. If a descriptive noun exists among the unit nouns, a meaningful analyzing unit(106) determines meaningful information. According to the affix processing and meaning standing information and meaning restriction conditions, a unit noun determination unit(108) determines a unit noun area by weight applying.
Abstract:
PURPOSE: A syntax analyzing method and a device thereof are provided to prevent creation of a chart or adjust chart weight by being matched previously constructed constraint condition. CONSTITUTION: A part-of-speech tagger(10) performs part of speech tagging about an original. A syntax information generator(20) generates structure syntax information about the tagging result. A chart parser(30) uses a chart about the morpheme sentence structure information as a default inactive chart, repeats rule matching and active and inactive chart generation, and performs bottom-up chart parsing. A node syntactic information generator(40) generates node syntactic information according to parsing result. A constraint condition application unit(50) applies a constraint condition according to the chart parsing result.
Abstract:
본 발명은 사용자의 개입을 통해 번역의 품질을 향상시키는 대화식 기계 번역 장치에 관한 것으로서, 특히 번역 과정에서 생성된 정보에 기반하여 번역 오류를 추정하고 사용자의 수정에 따른 재번역 결과를 실시간으로 제공하는 실시간 대화식 기계 번역 장치 및 방법에 관한 것이다. 본 발명에 따른 대화식 기계 번역 장치는 원문의 형태소 및 구문을 분석하여 원문 분석 정보를 생성하는 형태소/구문 분석기 및 상기 원문 분석 정보에 기반하여 번역문 및 번역문 생성 정보를 생성하는 번역문 생성기를 구비하는 기계 번역 엔진 및 상기 원문 분석 정보 및 상기 번역문 생성 정보에 기반하여 상기 원문 및 상기 번역문의 문장 구조 및 대응관계를 사용자에게 표시하고 상기 사용자로부터 상기 원문 또는 상기 번역문에 대한 수정사항을 입력받는 사용자 인터페이스 모듈로 구성된다. 본 발명은 사용자가 오번역이 발생한 부분 및 원인을 효과적으로 식별하고 수정할 수 있는 사용자 인터페이스를 제공하고 수정에 따른 재번역의 결과를 신속히 제공함으로써, 사용자가 만족할 수 있는 고품질의 번역을 수행할 수 있다. 기계 번역, 사용자 개입, 대화식 기계 번역, IMT
Abstract:
PURPOSE: A machine translation error detection method using the parallel corpus and an apparatus thereof are provided so that by providing an error statistics information classified as for each type the reading mistake generating in the machine translation system of the rule base is detected. The performance of the machine translation system is improved. CONSTITUTION: A part of analyzing morpheme(104) analyzes the morpheme of the purpose language sentence interpreted by machine with the purpose language sentence of the parallel corpus corresponding to the primitive language sentence. It classifies into the word by word. A word by word sorter(106) stands in line the group of the purpose language sentence interpreted by machine and primitive language sentence and the group of the purpose language sentence of the primitive language sentence and parallel corpus to the word by word. It decodes. An error detection part(108) detects error through the comparison of the word by word of the decoded sentences as described above from the purpose language sentence interpreted by machine. It classifies error and the error category and performance analysis part(110) inspect the error pattern ratio. Error data is produced.