Abstract:
본 발명에 의한 전문 분야의 부분 대역 패턴 데이터베이스 자동 구축 장치 및 방법은 용언 대역어와 조사 대역어 선택을 위한 어휘/의미 공기 정보를 구축하는 단계; 텍스트 말뭉치에 대하여 국소단문을 생성하는 단계; 상기 국소 단문에 대하여 부분 대역 패턴 후보를 생성하는 단계; 상기 어휘/의미 공기 정보를 기초로 상기 부분 대역 패턴 후보에 대한 목적언어 대역 표현을 생성하여 저장하는 단계;를 포함하는 것을 특징으로 하며, 구축된 전문 분야별 부분 대역 패턴 데이터베이스를 활용하여 기술 매뉴얼, 특허 문서 등의 기술 문서 자동번역에 중요한 언어 자원으로써 직접 활용할 수 있다. 전문 분야, 부분 대역 패턴 데이터베이스
Abstract:
본 발명은 한-중 기계번역시스템의 용언구 패턴 자동 확장 및 검증 장치에 관한 것으로서, 현재 한국어와 중국어 용언구 패턴 사전에서 보유한 용언구 패턴으로 적용이 되지 않는 용언구 패턴 원문부를 자동으로 추출하고, 이에 대해 중국어 대역어를 기반으로 하는 새로운 한-중 용언구 패턴을 자동 생성하는 한편, 새롭게 생성된 하나의 한-중 용언구 패턴을 유사한 복수의 용언구 패턴 후보로 자동 확장한 다음, 자동 확장된 한-중 용언구 패턴 후부들에 대하여 대용량 코퍼스 기반의 자동 검증 작업을 수행하여 적합한 용언구 패턴을 한국어와 중국어 용언구 패턴 사전DB에 새롭게 등록하고, 오류패턴으로 판정된 용언구 패턴을 오류패턴DB에 따로 저장한 후 재사용하여 새로 생성되는 한국어와 중국어 용언구 패턴의 정확도를 높이도록 되어 있다. 본 발명은 한국어와 중국어 용언구 패턴을 자동으로 용이하게 대량 수집할 수 있고, 이처럼 자동으로 증가되는 용언구 패턴에 의해 한-중 기계번역시스템의 번역률의 신속한 상승을 이룰 수 있는 효과가 있다.
Abstract:
본 발명은 다 어절로 이루어진 복합 형태소를 분석하고자 하는 경우 어절의 경계를 결정하기 위한 어절 정보를 사용하지 않고 이를 대신하여 형태소 분석을 위한 분석 단위를 음절이나 음소에서 형태소 단위로 향상시켜 복합 형태소를 분석하는 장치 및 방법에 관한 것이다. 본 발명은 분석된 형태소 결과가 띄어쓰기에 의해 어절 단위로 구분되어 있어서도, 인접한 어절의 다른 형태소와 연결하여 묶였을 때 독립된 품사 역할을 수행할 수 있는 복합 명사, 보조용언과 같은 형태소를 복합 형태소로 정의하고, 띄어쓰기 정보와 어절 내 형태소를 이용한 효율적인 복합 형태소 분석 방법을 제공한다.
Abstract:
PURPOSE: A device and a method for translating a 'do' verb of an automatic Korean-Chinese translating system based on a verb phrase pattern are provided to improve a performance of the translation system while reducing a number of the verb phrase patterns needed from the translation system by analyzing a structure of a Korean sentence and converting/generating the Chinese. CONSTITUTION: A morpheme analyzer(101) receives/analyzes a morpheme of the Korean sentence. A sentence structure analyzer(102) analyzes the sentence structure by using the verb phrase pattern. A translated sentence converter(103) converts/generates a translated Chinese expression by using an analysis result of the sentence structure. A morpheme generator(104) generates the final Chinese sentence by receiving the result from the translated sentence converter and generating a Chinese vocabulary morpheme.
Abstract:
PURPOSE: A passive and causative sentence structure analysis system and method is provided to enhance the case information determination performance by using the case frames, and to reduce the case frame number. CONSTITUTION: The system comprises a morpheme analyzer(10), a sentence normalizer(20), an active type case frame(30), a case frame converter(40), a case frame applicator(50), and a sentence structure analysis tree generator(60). The morpheme analyzer(10) analyzes the morphemes of an input passive or causative type sentence written in Hangul. The sentence normalizer(20) converts the morpheme analysis result into an active type sentence. The active type case frame(30) determines the case information based on the sentence normalization result of the sentence normalizer(20). The case frame converter(40) automatically converts auxiliary words and verb conjugations of the active type sentence into those of corresponding passive or causative type sentence for generating a passive or causative type conversion case frame. The case frame applicator(50) compares the morpheme analysis result with the conversion case frame, compares the sentence normalization result with the active type case frame, gives a weighting factor to a case frame according to a comparison result, and determines the case frame with the highest weighting factor as a final case frame. The sentence structure analysis tree generator(60) determines the case information based on the final case frame, analyzes the input passive or causative type sentence, and generates a sentence structure analysis result.