Abstract:
PURPOSE: A method and apparatus for generating and analyzing predicate for Chinese-Korean machine translation are provided to generate accurate Korean sentence by dividing past and present tenses. CONSTITUTION: A Chinese morpheme analyzing unit(101) divides a Chinese word included in a Chinese sentence. A Chinese morpheme analyzing unit(102) analyzes Chinese sentence and generates a Chinese syntactic tree. A Chinese/Korean selecting unit(103) converts Chinese syntactic tree into Korean syntactic tree. A Korean generating unit(105) rearranges Korean words by using a Korean syntactic tree.
Abstract:
PURPOSE: An automatic interpretation terminal, a service, a system and method for servicing automatic interpretation are provided to supply rapid and exact interpretation service by directly performing interpretation and relay interpretation by utilizing a plurality of interpretation supporters and providing an interpretation result to a terminal of a user. CONSTITUTION: A communication unit(300) receives interpretation request from a user. The communication unit transmits an interpretation result according to the interpretation request. A interpretation applicant information DB(306) stores a list information of the interpretation supporters capable of performing interpretation as a target language. A server control unit(304) searches interpretation supporter capable of interpreting the request target language.
Abstract:
PURPOSE: A speaker adaptation system and a method thereof are provided to utilize the cumulative variable for obtaining enough statistics for the non-instruction adaptation in voice recognitioin process without performing an adaptation training thereby enabling to gradual adaptation. CONSTITUTION: A characteristic detecting part(110) extracts an eigenvector from a voice signal. A sound model storage(120) stores an acoustic model consisting of a recursive tree. A conversion parameter class determiner(130) produces gaussian posteriori probability of a candidate state based on the eigenvector and the sound model and determines the cumulative variable and a conversion parameter class based on the gaussian posterior probability. A sound model updater(140) produces the conversion parameter based on the conversion parameter class and cumulative variable and renews the acoustic model.
Abstract:
PURPOSE: A substitute adverb generating device and a method thereof are provided to determine generation location of adverb within predicate phrase in a Chinese target auto translation and determine substitute language of the determined position, thereby solving the ambiguity on meaning. CONSTITUTION: A multi adverb pattern applying unit(102) recognizes multiple adverb within inputted predicate phrase. The multi adverb pattern applying unit selects substitute multi adverb. A negative type recognizing and generating unit(108) recognizes negative adverb. The negative type recognizing and generating unit selects substitute negative adverb. An adverb-predicate pattern applying unit(112) determines adverb generating location through adverb-predicate pattern. The adverb-predicate pattern applying unit selects substitute adverb.
Abstract:
PURPOSE: A translation word extractor device is provided to collect a web news and extract a translation word about a neologism or foreign language within a bracket and quotation symbol form a collected web news, thereby constructing a translation dictionary using the extracted translation word. CONSTITUTION: A web news collection unit(102) collects RSS(Really Simple Syndication) news list in real time. The web news collection unit extracts a web news corresponding to the collected RSS news list. Based on bracket and quotation symbols of the extracted web news, a translation word extractor(104) separates the sentence. The translation word extractor extracts word boundary corresponding to the bracket through LCS(Longest Common Substring) algorithm. The translation word extractor extracts a translation pair according to the extracted word border.
Abstract:
PURPOSE: A method for generating Korean connectives for Chinese-Korean machine translation and a device thereof are provide to generate clear vision of connectives in Korean point of view and generate Korean sentence, thereby generating high quality of Korean. CONSTITUTION: A Chinese morpheme analyzer(101) selects optimum morpheme part about Chinese word in a Chinese input sentence. A Chinese construction analyzer generates a Chinese construction tree. A Chinese-Korean converter(103) converts the Chinese construction tree into Korean construction tree. If an inter-short sentence logical connection mark is inexplicit, a connective ending determining unit(104) generates inter-short connection ending through connective knowledge DB(106). A Korean generator(105) generates natural Korean.
Abstract:
1. 청구범위에 기재된 발명이 속한 기술분야 복수의 이미지 셋을 포함하는 비디오 시퀀스에 대한 감소된 비트를 갖는 에지 히스토그램 기술자의 비트 표현을 구성하는 방법 및 상기 에지 히스토그램 기술자의 부호화된 표현으로부터 효과적으로 추출된 정보를 이용하여 비디오 시퀀스를 검색하는 방법에 관한 것임. 2. 발명이 해결하고자 하는 기술적 과제 텍스쳐 비디오를 포함하는 대응 비디오 시퀀스를 검색하는 방법을 제공함. 3. 발명의 해결 방법의 요지 복수의 비디오 시퀀스를 표현하는 디지털 비디오 데이터 정보 - 상기 복수의 비디오 시퀀스 각각은 상기 디지털 비디오 데이터의 이미지 프레임 셋을 포함함 - 를 갖는 데이터베이스 구축 방법에 있어서, 상기 각 비디오 시퀀스의 상기 각 이미지 프레임을 L개(L은 양의 정수)의 부영상(sub-image) - 상기 각 부영상은 S x T개(S 및 T는 각각 양의 정수)의 이미지 블럭(image-block)으로 더욱 분할됨 - 으로 분할하는 제1단계; 상기 각 이미지 블럭에 대해 5개의 기준 에지(reference edge) - 상기 기준 에지는 4개의 방향성(directional) 에지 및 1개의 무방향성(non-directional) 에지를 포함함 - 중 어느 하나를 할당하여 상기 각 이미지 프레임에 대해 L개의 에지 히스토그램(edge histogram) - 상기 에지 히스토그램은 M개의 에지 히스토그램 빈(edge histogram bin)을 포함함 - 을 생성하는 제2 단계; 상기 각 에지 히스토그램에 포함된 상기 에지 히스토그램 빈을 S x T로 정규화하여 상기 각 이미지 프레임에 대해 M개의 정규화된 에지 히스토그램 빈을 생성하는 제3단계; 상기 각 이미지 프레임의 정규화된 에지 히스토그램 빈에 기초하여 상기 각 비디오 시퀀스에 대한 L개의 대표(representative) 에지 히스토그램을 생성하기 위해 상기 각 비디오 시퀀스에 대해 M개의 대표 에지 히스토그램 빈을 계산하는 제4단계; 및 상기 데이터베이스에 저장되는 상기 각 대표 에지 히스토그램에 대한 제2이미지 기술자로서 M개의 양자화 인덱스값을 생성하기 위해 상기 대표 에지 히스토그램 빈을 비선형적으로 양자화하는 제5단계를 포함함. 4. 발명의 중요한 용도 비디오 시퀀스 검색에 이용됨.
Abstract:
본 발명은 다단계 용언구 패턴을 적용한 번역장치와 이를 위한 적용방법 및 추출방법에 관한 것으로, 다단계 용언구 패턴 매칭 기법을 적용하여 번역성능을 향상시키고, 번역장치를 위한 용언구 패턴을 다단계로 적용하며, 다단계 용언구 패턴을 자동으로 추출함으로써 고성능의 기계번역장치를 구축할 수 있다. 또한, 본 발명은 다단계 용언구 패턴을 적용한 번역장치와 이를 위한 적용방법 및 추출방법을 제공함으로써 원시언어에서 목적언어로 변환하는 데 사용되며 어휘적인 측면과 어순 등 언어 구조적인 측면에서 이종 언어간에 발생하는 중의성을 해소할 수 있다. 용언구 패턴, 다단계, 매칭, 적용
Abstract:
본 발명은 패턴기반 자동번역(Pattern Based Machine Translation) 방식의 장점과 통계기반 자동번역(Statistical Machine Translation) 방식의 장점을 혼합한 하이브리드 자동번역 기술에 관한 것이다. 본 발명은, 형태소 분석기를 이용하여 한국어 문장에 대한 형태소 분석 결과를 생성하는 단계, 형태소 분석 결과를 입력으로 하고 구문분석기를 이용하여 구문분석 결과를 생성하는 단계, 원문부 번역 매니저를 이용하여 원문의 분석 결과를 보정하는 단계, 원문부 번역 매니저 내에서 문장 분절을 수행하는 단계, 원문부 번역 매니저 내에서 문형 매칭을 수행하는 단계, 원문부 번역 매니저 내에서 패러프레이징(Paraphrasing)을 수행하는 단계, PBMT 생성기에서 번역 결과를 생성하는 단계, PBMT 생성기에서 SMT 번역 결과를 호출하는 단계, SMT에서 보정된 원문 분석 결과를 이용해 번역 결과를 생성하는 단계, 대역문 번역 매니저에서 최종 번역 결과를 생성하는 단계, 대역문 합성기에서 PBMT 및 SMT 번역 결과를 이용하여 최종 대역문 후보를 생성하는 단계, 대역문 합성기에서 생성한 대역문 후보들에 대해 가장 적절한 대역문 결과를 평가하여 선정하는 단계를 포함한다. 본 발명에 의하면, 첫째, 한국어 문장을 정확하게 분절할 수 있으며, 둘째, 분절을 통해 번역 속도를 향상할 수 있으며, 셋째, 분절을 통해 번역 성능을 향상시킬 수 있으며, 넷째, 입력문에 대한 패러프레이징을 수행함으로써 분석 및 번역 성능을 개선시킬 수 있고, 다섯째, 대역문 선택기를 개발함으로써 보다 우수한 번역 결과를 최종적으로 생성할 수 있다. 통계기반 자동번역, 패턴기반 자동번역, 패러프레이징, 문장 분절, 대역문 선택
Abstract:
A method and an apparatus for selecting a translated word in a machine translation are provided to obtain more natural translation quality by applying a translated word selecting scheme to the machine translation, and to get wanted information from a document written in foreign languages more easily and cheaply. A method for selecting a translated word in a machine translation comprises the following several steps. A co-occurring word class information applying unit checks whether a target word with respect to a word of a source sentence can be determined as a translated word by using a co-occurring word class information database(S300). In case that the target word is not determined from the co-occurring word class information database(S301), a meaning determining unit solves meaning ambiguity of the target word(S302). If the meaning determining unit solves the meaning ambiguity or the number of translated words of a target noun word is more than 2 but the translated words share the same meaning code, the translated word determining unit determines an optimal translated word by using a target language local context statistics information database which is constructed from a target language corpus in order to select more precise translated word(S303,S304).