Abstract:
A method and a device for constructing a semantic co-occurrence information knowledge-base are provided to minimize information distortion of the semantic co-occurrence information by using lexical co-occurrence information and a noun meaning code dictionary. A morpheme analyzer(110) outputs a morpheme analysis result from a corpus(100). A lexical co-occurrence information generator(120) constructs the lexical co-occurrence information knowledge-base(125) from the morpheme analysis result. A lexical co-occurrence information generator(140) constructs the semantic co-occurrence information knowledge-base(145) by using the noun meaning code dictionary(130) to relax data shortage of the lexical co-occurrence information knowledge-based constructed by the lexical co-occurrence information generator.
Abstract:
본 발명에 의한 전문 분야의 부분 대역 패턴 데이터베이스 자동 구축 장치 및 방법은 용언 대역어와 조사 대역어 선택을 위한 어휘/의미 공기 정보를 구축하는 단계; 텍스트 말뭉치에 대하여 국소단문을 생성하는 단계; 상기 국소 단문에 대하여 부분 대역 패턴 후보를 생성하는 단계; 상기 어휘/의미 공기 정보를 기초로 상기 부분 대역 패턴 후보에 대한 목적언어 대역 표현을 생성하여 저장하는 단계;를 포함하는 것을 특징으로 하며, 구축된 전문 분야별 부분 대역 패턴 데이터베이스를 활용하여 기술 매뉴얼, 특허 문서 등의 기술 문서 자동번역에 중요한 언어 자원으로써 직접 활용할 수 있다. 전문 분야, 부분 대역 패턴 데이터베이스
Abstract:
본 발명은 다 어절로 이루어진 복합 형태소를 분석하고자 하는 경우 어절의 경계를 결정하기 위한 어절 정보를 사용하지 않고 이를 대신하여 형태소 분석을 위한 분석 단위를 음절이나 음소에서 형태소 단위로 향상시켜 복합 형태소를 분석하는 장치 및 방법에 관한 것이다. 본 발명은 분석된 형태소 결과가 띄어쓰기에 의해 어절 단위로 구분되어 있어서도, 인접한 어절의 다른 형태소와 연결하여 묶였을 때 독립된 품사 역할을 수행할 수 있는 복합 명사, 보조용언과 같은 형태소를 복합 형태소로 정의하고, 띄어쓰기 정보와 어절 내 형태소를 이용한 효율적인 복합 형태소 분석 방법을 제공한다.
Abstract:
PURPOSE: A device and a method for translating a 'do' verb of an automatic Korean-Chinese translating system based on a verb phrase pattern are provided to improve a performance of the translation system while reducing a number of the verb phrase patterns needed from the translation system by analyzing a structure of a Korean sentence and converting/generating the Chinese. CONSTITUTION: A morpheme analyzer(101) receives/analyzes a morpheme of the Korean sentence. A sentence structure analyzer(102) analyzes the sentence structure by using the verb phrase pattern. A translated sentence converter(103) converts/generates a translated Chinese expression by using an analysis result of the sentence structure. A morpheme generator(104) generates the final Chinese sentence by receiving the result from the translated sentence converter and generating a Chinese vocabulary morpheme.
Abstract:
PURPOSE: A passive and causative sentence structure analysis system and method is provided to enhance the case information determination performance by using the case frames, and to reduce the case frame number. CONSTITUTION: The system comprises a morpheme analyzer(10), a sentence normalizer(20), an active type case frame(30), a case frame converter(40), a case frame applicator(50), and a sentence structure analysis tree generator(60). The morpheme analyzer(10) analyzes the morphemes of an input passive or causative type sentence written in Hangul. The sentence normalizer(20) converts the morpheme analysis result into an active type sentence. The active type case frame(30) determines the case information based on the sentence normalization result of the sentence normalizer(20). The case frame converter(40) automatically converts auxiliary words and verb conjugations of the active type sentence into those of corresponding passive or causative type sentence for generating a passive or causative type conversion case frame. The case frame applicator(50) compares the morpheme analysis result with the conversion case frame, compares the sentence normalization result with the active type case frame, gives a weighting factor to a case frame according to a comparison result, and determines the case frame with the highest weighting factor as a final case frame. The sentence structure analysis tree generator(60) determines the case information based on the final case frame, analyzes the input passive or causative type sentence, and generates a sentence structure analysis result.