-
公开(公告)号:KR1020100041019A
公开(公告)日:2010-04-22
申请号:KR1020080099995
申请日:2008-10-13
Applicant: 한국전자통신연구원
IPC: G06F17/28
CPC classification number: G06F17/271 , G06F17/2872
Abstract: PURPOSE: A document translation device and a method thereof are provided to improve the translation selection performance through text analysis and to improve the translation accuracy and readability of English documents. CONSTITUTION: A document processing block(102) performs morpheme analysis/tagging about an inputted English document. The document processing block analyzes statistic information. The document processing block outputs a tagging result in which the text analysis information is reflected. A document translation block(104) performs structure analysis/structure conversion about the tagging result outputted from the document processing block. The document translation block outputs a translated document corresponding to the inputted English document.
Abstract translation: 目的:提供文本翻译装置及其方法,通过文本分析提高翻译选择性能,提高英文文本的翻译准确性和可读性。 构成:文档处理块(102)对输入的英文文档执行语素分析/标记。 文档处理块分析统计信息。 文档处理块输出反映文本分析信息的标记结果。 文档翻译块(104)对从文档处理块输出的标记结果执行结构分析/结构转换。 文档翻译块输出与输入的英文文档相对应的翻译文档。
-
22.
公开(公告)号:KR1020090061158A
公开(公告)日:2009-06-16
申请号:KR1020070128041
申请日:2007-12-11
Applicant: 한국전자통신연구원
IPC: G06F17/28
CPC classification number: G06F17/2854 , G06F17/2715 , G06F17/2755
Abstract: A translation error correcting method using error correction patterns in a translation system and an apparatus thereof are provided to improve the translation performance by correcting translation errors in real time. An error correction pattern is constructed through the error correction learning which uses the bilingual corpus including translation correct answer sentences of an object language form for a source language sentence(200). The translation for a specific sentence is performed by using an automatic translator(204). By comparing the translated sentence with the conditional part of the error correction pattern, a translation error is grasped(206). The predicted translation error is corrected and outputted(208,210).
Abstract translation: 提供了使用翻译系统中的纠错模式的翻译错误校正方法及其装置,以通过实时校正翻译错误来提高翻译性能。 通过误差校正学习构建误差校正模式,其使用双语语料库,其包括源语言句子(200)的对象语言形式的翻译正确答案。 通过使用自动翻译器(204)来执行特定句子的翻译。 通过比较翻译后的句子与错误校正模式的条件部分,掌握翻译错误(206)。 校正并输出预测的平移误差(208,210)。
-
公开(公告)号:KR1020090048319A
公开(公告)日:2009-05-13
申请号:KR1020080104184
申请日:2008-10-23
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2755 , G06F17/2264 , G06F17/2785
Abstract: 본 발명은 명사가 여러 게 나열되는 복합 명사 내부의 의미 구조 분석을 통해 의미의 왜곡이 없는 문장 형태로 변환하여, 명사가 나열된 형태에서 생략된 문장 성분을 자동으로 복원하여 의미 왜곡이 없는 문장으로 생성하는 문장 성분 복원 장치 및 그 방법에 관한 것이다. 본 발명에 의해, 분석된 복합 명사의 의미 구조를 바탕으로 의미를 왜곡시키지 않으면서, 다른 형태의 표현을 생성할 수 있게 된다.
-
公开(公告)号:KR1020090015604A
公开(公告)日:2009-02-12
申请号:KR1020070080065
申请日:2007-08-09
Applicant: 한국전자통신연구원
CPC classification number: G06F17/28
Abstract: A method for constructing translation knowledge and an apparatus thereof are provided to minimize time and cost required in obtaining knowledge by automating a whole process of translation knowledge obtaining. A method for constructing translation knowledge comprises the following steps: a step for converting a source language sentence and a target language sentence into a form in which sentence structure information is expressed(S410); a step for encoding a form of the source language and the target language to a native identification number(S420); a step for performing a word arrangement by self-control learning(S430); a step for correcting an arrangement error(S440); a step for performing a sentence structure arrangement with dependency relationship information of the source language and a word arrangement result(S450); and a step for extracting a word/sentence structure knowledge by using a word/sentence structure arrangement result(S460).
Abstract translation: 提供了一种构建翻译知识的方法及其装置,以通过自动化翻译知识获取的整个过程来最小化获得知识所需的时间和成本。 一种用于构建翻译知识的方法包括以下步骤:将源语言句和目标语句转换成表达句子结构信息的形式的步骤(S410); 用于将源语言和目标语言的形式编码为本地标识号的步骤(S420); 通过自我控制学习进行词汇安排的一个步骤(S430); 纠正排列错误的步骤(S440); 执行具有源语言的依赖关系信息和词排列结果的句子结构排列的步骤(S450); 以及通过使用单词/句子结构排列结果来提取单词/句子结构知识的步骤(S460)。
-
公开(公告)号:KR100831037B1
公开(公告)日:2008-05-20
申请号:KR1020060096341
申请日:2006-09-29
Applicant: 한국전자통신연구원
Abstract: 본 발명은 기계번역에 이용되는 대역어 자동 선정 방법 및 장치에 관한 것으로서, 구체적으로는 병렬 말뭉치(Bilingual Corpus)를 이용하여 기존의 대역어 사전에 등록되어 있지 않은 신조어(미등록어)에 대한 대역어를 자동으로 선정할 수 있는 방법 및 장치에 관한 것이다.
본 발명은 원시언어 문장 및 이에 대응하는 목표언어 대역문으로 이루어진 병렬 말뭉치를 이용하여 대역어를 자동 선정하는 방법을 제공한다. 상기 방법은, 상기 원시언어 문장에 대한 형태소 분석 및 구조 분석을 수행하여 상기 문장에 포함된 단어들에 대한 품사 정보를 분석하고 상기 단어들간의 문법적 관계를 판단하는 단계와, 상기 원시언어 문장의 단어들중 대역어 사전에 존재하지 않는 미등록어를 추출하는 단계와, 상기 추출된 미등록어와 문법적 관계가 있는 주변 단어를 상기 원시언어 문장으로부터 선별하는 단계와, 상기 목표언어 대역문에서 상기 주변 단어에 대응하는 대역어를 제거한 후에 남은 단어를 상기 미등록어의 대역어로 선정하는 단계를 포함한다.
기계번역, 병렬 말뭉치(bilingual corpus), 대역어-
26.
公开(公告)号:KR1020080019126A
公开(公告)日:2008-03-03
申请号:KR1020060080921
申请日:2006-08-25
Applicant: 한국전자통신연구원
IPC: G06F17/28
CPC classification number: G06F17/2827
Abstract: A domain-adaptive portable caption machine translation device using dynamic translation resources and a method thereof are provided to improve translation performance for various specialized fields by automatically recognizing a style/field of caption and dynamically forming an optimal translation module and knowledge suitable for a recognition result. A core word extractor(102) extracts a core word for recognizing a style and a field from a caption sentence of a received broadcasting signal. A style/field recognizer(103) recognizes the style/field of the caption sentence based on the extracted core word and various dictionaries. A dynamic translation knowledge former(104) forms translation knowledge dynamically based on the recognized style/field and loads the formed translation knowledge to a dynamic translation database(206). A dynamic translation module former(105) reforms a translation module dynamically based on the recognized style/field. A morpheme analyzer(106) analyzes morphemes of the caption sentence. A style pattern applier(107) performs translation in a sentence unit by applying a style pattern to the caption sentence. A phrase analyzer(108) analyzes phrases of the caption sentence. A pattern-based translation generator(109) generates a pattern-based translation for the caption sentence based on a phrase analysis result.
Abstract translation: 提供了使用动态翻译资源的领域适应性便携式字幕机翻译装置及其方法,以通过自动识别字幕的风格/领域并动态地形成适合于识别结果的最佳翻译模块和知识来改善各种专业领域的翻译性能 。 核心词提取器(102)从接收到的广播信号的标题语句中提取用于识别风格和字段的核心字。 风格/场识别器(103)基于所提取的核心字和各种字典来识别字幕句的风格/字段。 动态翻译知识前者(104)基于识别的样式/字段动态地形成翻译知识,并将形成的翻译知识加载到动态翻译数据库(206)。 动态翻译模块前者(105)基于公认的风格/领域动态地改写翻译模块。 语素分析器(106)分析字幕句子的语素。 风格图案施加器(107)通过对标题语句应用风格模式来执行句子单元中的翻译。 短语分析器(108)分析标题语句的短语。 基于模式的翻译生成器(109)基于短语分析结果生成用于标题语句的基于模式的翻译。
-
公开(公告)号:KR100805191B1
公开(公告)日:2008-02-21
申请号:KR1020060091102
申请日:2006-09-20
Applicant: 한국전자통신연구원
CPC classification number: G06F17/274 , G06F17/2863
Abstract: A method and a device for restoring an ellipsis component in a Korean sentence are provided to generate a correct English translation and improve quality of a translation system by finding an ellipsis component from the Korean sentence and restoring the ellipsis component based on a heuristic rules or a raw corpus. A paragraph recognizer(310) recognizes a start and finish range of an inputted sentence. A paragraph storing part(320) stores the inputted sentence in a declinable word phrase unit based on a paragraph analyzed result of the inputted sentence. An ellipsis recognizer(330) checks whether the declinable word phrase having the ellipsis component to be restored is found from the current sentence. A declinable word comparator(350) compares similarities between declinable word information stored in the paragraph storing part and the current sentence. An antecedent selector(340) checks antecedent candidates for the ellipsis component, determines priority of the antecedent candidates, and determines an antecedent among the antecedent candidate based on a comparison result.
Abstract translation: 提供了一种用于恢复韩语句子中的省略号分量的方法和装置,用于通过从韩语句子中找到省略号分量来产生正确的英文翻译,并提高翻译系统的质量,并根据启发式规则或 原始语料库 段识别器(310)识别输入的句子的开始和结束范围。 段存储部分(320)基于所输入的句子的段落分析结果将输入的句子存储在可拒绝的词组单元中。 省略号识别器(330)检查从当前句子中是否找到具有要恢复的省略号分量的可下降词组短语。 可下降字词比较器(350)比较存储在段落存储部分中的可下降字词信息与当前句子之间的相似性。 前提选择器(340)检查前提候选者的省略号分量,确定先行候选者的优先级,并根据比较结果确定先行候选者中的先行词。
-
公开(公告)号:KR100792204B1
公开(公告)日:2008-01-08
申请号:KR1020060056203
申请日:2006-06-22
Applicant: 한국전자통신연구원
Abstract: 본 발명은 특허 문서를 번역 대상으로 하여 특허 도메인에 특화된(customized) 번역 지식(translation knowledge)을 추출하고 이렇게 추출된 특화된 지식을 사용하여 특허 문서를 자동 번역하는 방법 및 그 장치에 관한 것으로, 특허 문서로부터 전문용어를 대량으로 추출하고 추출된 전문용어에 대하여 대역어를 할당하며, 일반 도메인의 문서가 아닌 특허 문서에서 고빈도로 사용되는 표현들을 추출하고 해당 표현들에 대한 대역 표현을 구축하며, 이렇게 구축된 번역 지식을 사용하고, 또한 특허문서에서의 과대하게 긴 문장들에 대해 문형패턴 적용, 병렬구조 인식 및 구문단서에 의한 문장분할 등을 수행하여, 파싱 가능한 번역 단위를 추출하여 구조분석을 수행하는 특허 문서를 자동으로 번역하는 장치 및 방법을 제공하는데 있다.
기계번역, 자동번역, 지식추출, 특허번역-
-
公开(公告)号:KR100687735B1
公开(公告)日:2007-02-27
申请号:KR1020050020033
申请日:2005-03-10
Applicant: 한국전자통신연구원
IPC: G06F17/28
Abstract: 본 발명에 의한 명사 의미 코드 부착 방법 및 그 장치에 의하면, 영한 자동 번역 방법에 있어서, 사전에 등재할 명사 표현에 대역어를 부착하는 단계; 상기 대역어가 부착된 명사 표현에서 핵심 명사를 추출하는 단계; 및 상기 명사 표현에 의미코드를 부착하는 단계;를 포함하는 것을 특징으로 하며, 자동번역 시스템에서 명사 의미코드 부착 방식을 수동 부착 방식에서 반자동 부착방식으로 전환시킴으로서, 명사에 의미코드를 부착하는 시간을 단축할 수 있으며, 명사에 의미코드가 일관성 있게 부착될 수 있고, 명사 의미코드가 부착됨으로 번역 정확도가 향상되며, 동사 대역어 선택시에 명사의 의미코드를 논항으로 사용함으로써 동사 대역어 선택의 커버리지를 향상시킬 수 있는 효과가 있다.
영한 자동번역, 명사 의미코드 부착
-
-
-
-
-
-
-
-
-