Abstract:
본 발명에 의한 영한 자동번역을 위하여 동사구 패턴 및 의미 벡터를 사용하는 동사/명사 대역어 선택 장치 및 그 방법은 영한 병렬 코퍼스와 영어 모노링궐(monolingual) 코퍼스 및 워드넷에 기반한 의미코드를 기초로 동사구 패턴 데이터베이스를 구축하는 단계; 원문과 대역문의 쌍으로 이루어지는 병렬 코퍼스내의 각 문장 쌍에 대하여 어휘 정렬을 수행한 후 의미벡터 및 한국어 국소 문맥 정보를 구축하는 단계; 입력되는 문장을 단문 단위로 분할하여 상기 동사구 패턴 데이터베이스를 참조하여 상기 단문에 적용할 동사구 패턴을 검색하는 단계; 상기 검색에 성공하면 검색된 동사구 패턴을 기초로 동사의 대역어와 각 논항의 명사 의미코드를 결정하는 단계; 상기 검색에 실패하고 상기 동사구 패턴이 적용되지 않는 경우에는 소정의 디폴트 동사구 패턴을 적용하여 기본적인 동사 대역어를 선정하는 단계; 및 상기 검색에 실패하고 상기 동사의 논항이 명사구이면 영어 공기 어휘를 이용하여 의미코드를 결정하는 단계;를 포함하는 것을 특징으로 하며, 동사구 패턴에 의해 동사와 헤드 명사에 대한 대역어를 선택하고, 또한 공기 정보에 의해 헤드 명사가 아닌 기타 명사에 대한 대역어 선택도 가능하다. 기계번역, 자동번역, 대역어 선택, 의미 벡터, 동사구 패턴
Abstract:
본 발명에 의한 영한 자동번역을 위하여 동사구 패턴 및 의미 벡터를 사용하는 동사/명사 대역어 선택 장치 및 그 방법은 영한 병렬 코퍼스와 영어 모노링궐(monolingual) 코퍼스 및 워드넷에 기반한 의미코드를 기초로 동사구 패턴 데이터베이스를 구축하는 단계; 원문과 대역문의 쌍으로 이루어지는 병렬 코퍼스내의 각 문장 쌍에 대하여 어휘 정렬을 수행한 후 의미벡터 및 한국어 국소 문맥 정보를 구축하는 단계; 입력되는 문장을 단문 단위로 분할하여 상기 동사구 패턴 데이터베이스를 참조하여 상기 단문에 적용할 동사구 패턴을 검색하는 단계; 상기 검색에 성공하면 검색된 동사구 패턴을 기초로 동사의 대역어와 각 논항의 명사 의미코드를 결정하는 단계; 상기 검색에 실패하고 상기 동사구 패턴이 적용되지 않는 경우에는 소정의 디폴트 동사구 패턴을 적용하여 기본적인 동사 대역어를 선정하는 단계; 및 상기 검색에 실패하고 상기 동사의 논항이 명사구이면 영어 공기 어휘를 이용하여 의미코드를 결정하는 단계;를 포함하는 것을 특징으로 하며, 동사구 패턴에 의해 동사와 헤드 명사에 대한 대역어를 선택하고, 또한 공기 정보에 의해 헤드 명사가 아닌 기타 명사에 대한 대역어 선택도 가능하다. 기계번역, 자동번역, 대역어 선택, 의미 벡터, 동사구 패턴
Abstract:
본 발명에 의한 명사 의미 코드 부착 방법 및 그 장치에 의하면, 영한 자동 번역 방법에 있어서, 사전에 등재할 명사 표현에 대역어를 부착하는 단계; 상기 대역어가 부착된 명사 표현에서 핵심 명사를 추출하는 단계; 및 상기 명사 표현에 의미코드를 부착하는 단계;를 포함하는 것을 특징으로 하며, 자동번역 시스템에서 명사 의미코드 부착 방식을 수동 부착 방식에서 반자동 부착방식으로 전환시킴으로서, 명사에 의미코드를 부착하는 시간을 단축할 수 있으며, 명사에 의미코드가 일관성 있게 부착될 수 있고, 명사 의미코드가 부착됨으로 번역 정확도가 향상되며, 동사 대역어 선택시에 명사의 의미코드를 논항으로 사용함으로써 동사 대역어 선택의 커버리지를 향상시킬 수 있는 효과가 있다. 영한 자동번역, 명사 의미코드 부착
Abstract:
PURPOSE: An automatic morpheme semantics tagging system is provided to automatically tag semantics of morphemes by using syntax data and semantic co-occurrence data of a declinable phrase and a noun phrase so that it enhances a meaning determination correctness. CONSTITUTION: The system comprises a short sentence recognizer(102), an auxiliary word case recovery module(103), an argument noun meaning determination module(104), and a noun phrase meaning determination module(105). The short sentence recognizer(102) recognizes a short sentence by using a basic syntax generation rule, a dependency syntax rule, an electronic morpheme meaning dictionary, a semantics frame and a declinable phrase co-occurrence dictionary generated via a morpheme analysis of an original sentence. The auxiliary word case recovery module(103) performs a case recovery for an auxiliary word by using a semantics frame and a declinable phrase semantics co-occurrence dictionary. The argument noun meaning determination module(104) determines a meaning on an argument noun. The noun phrase meaning determination module(105) determines a meaning on a noun within a noun phrase and a compound noun.
Abstract:
PURPOSE: A method for searching a similar sentence on a translation support system is provided to improve accuracy of the system by offering a similarity measure between sentences for searching the most similar example from a translation memory, and outputting a searched source sentence and the corresponding translation sentence. CONSTITUTION: The translation memory(105) comprises the source sentence, a morpheme analysis result of the source sentence, and the translation sentence by performing the morpheme analysis of a parallel corpus(101) in not processed form through a morpheme analyzer(102). An index reverse-file(104) is formed by extracting an index word from each source sentence forming the translation memory(105). A filtering part(106) separately extracts the morpheme corresponding to a noun, a verb, and an adjective used as the index word from the inputted source sentence. A searching part(107) loads a searching result after searching the candidate sentences provided from the filtering part(106) through the translation memory(105). A similarity calculation part(108) calculates the similarity applying a weight of each part for the candidate sentences by using an edit distance method.
Abstract:
PURPOSE: A device for processing a caption signal of a set top box is provided to automatically translate foreign language of broadcasting including the caption signal into the native language, thereby improving language leaning function for a user. CONSTITUTION: A caption signal extracting part(101) extracts a caption signal included in a video signal inputted from a broadcasting receiving tuner(300). A translating part(102) translates the extracted caption signal into a set language. A synthesizing part(103) synthesizes the translated caption signal inputted from the translating part and the video signal provided from the caption signal extracting part for providing the synthesized signal to a broadcasting output device(200) according to a key input signal. A key input part(104) provides a key input signal for setting a caption display selection mode to the synthesizing part to display the translated caption signal to the broadcasting output device, and provides a key input signal to the synthesizing part to set a caption display position.
Abstract:
PURPOSE: A system and method for automatically performing a translation based on a sentence frame is provided to naturally generate a translated sentence by removing a structural ambiguity on the basis of a sentence frame, which represents a frame of a sentence. CONSTITUTION: A source language morpheme analyzer(20) analyzes a morpheme of a source language sentence, and detects information on parts of speech of each word. A translation dictionary(21) stores a source vocabulary, a substitutive word of the vocabulary and quality information related to the word. A phrase unit syntax analyzer(22) represents an input sentence using the information detected from the source language morpheme analyzer(20). An original frame searcher(23) searches a constraint. An original frame database(24) stores a basic constraint of a relevant original frame. A sentence frame converter(25) converts the original into morpheme columns of an object language. A translation sentence frame database(26) stores constraint information of an original slot and designated information of a translation sentence slot. A slot translation database(27) stores constraint information of a part of speech of the original and designated information of a part of speech of the translation. An object language morpheme generator(28) analyzes the morpheme of the object language.
Abstract:
PURPOSE: An apparatus and method for generating a translated sentence based on a partial translation pattern database is provided to generate a high-quality translated sentence at high speed by processing a language phenomenon, which is variously translated on the basis of a declinable word using a partial translation pattern database. CONSTITUTION: A partial syntax as the unit of a declinable word is detected from a syntax analysis result of a resource sentence. A partial translation pattern database is searched according to a key value. A partial translation pattern is detected through a matching with each component of the resource sentence inputted using a meaning category database. The optimal translation pattern is selected according to a priority among a plurality of candidate partial translation patterns detected. A partial translation sentence is generated according to a matching form of the translation pattern selected. A position between each adverb and a position in an input sentence are determined using generation information of an adverb. The adverb is added to the partial translation sentence using an adverb translation dictionary database. The generation information is processed. The final object language translated sentence is generated.
Abstract:
본 발명에 따른 자동 번역 시스템은 사용자로부터 상기 번역 원문을 입력받고, 상기 번역 사전을 이용하여 자동 번역하는 번역 엔진과, 상기 번역 엔진에서 번역된 결과에 대해 상기 사용자로부터 수정된 부분을 입력받는 번역 지식 편집기와, 상기 번역 지식 편집기에서 수정된 부분이 상기 번역 엔진 상의 오류인지 분석하는 번역 프로파일 학습기와, 상기 번역 프로파일 학습기에서 분석된 결과를 전달받아 상기 번역 사전에 반영하는 번역 사전 반영기를 포함하는 것을 특징으로 한다.