-
公开(公告)号:KR100975044B1
公开(公告)日:2010-08-11
申请号:KR1020080104184
申请日:2008-10-23
Applicant: 한국전자통신연구원
Abstract: 본 발명은 명사가 여러 게 나열되는 복합 명사 내부의 의미 구조 분석을 통해 의미의 왜곡이 없는 문장 형태로 변환하여, 명사가 나열된 형태에서 생략된 문장 성분을 자동으로 복원하여 의미 왜곡이 없는 문장으로 생성하는 문장 성분 복원 장치 및 그 방법에 관한 것이다. 본 발명에 의해, 분석된 복합 명사의 의미 구조를 바탕으로 의미를 왜곡시키지 않으면서, 다른 형태의 표현을 생성할 수 있게 된다.
-
公开(公告)号:KR1020100062826A
公开(公告)日:2010-06-10
申请号:KR1020090026452
申请日:2009-03-27
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2836 , G06F17/2755
Abstract: PURPOSE: A translation memory apply method for auto translation and an apparatus thereof are provided to perform automatic translation by matching an extended input sentence of a translation memory matching extension format with extended original sentences stored at an extension translation memory DB. CONSTITUTION: An extension unit(40) extends an input sentence, which goes via a morphological analysis, through a corresponding rule among translation memory extension rules, and generates a translation memory matching extension format. An extension translation memory matching unit(50) matches the input sentence of the created translation memory matching extension format with extended sentences stored at the translation memory DB. In addition, the extension translation memory matching unit outputs the translation results corresponding to the matched extended original sentences.
Abstract translation: 目的:一种用于自动翻译的翻译记忆库应用方法,并且提供一种装置,用于通过将翻译记忆体匹配扩展格式的扩展输入句与扩展翻译存储器DB中存储的扩展原始句子相匹配来执行自动翻译。 构成:扩展单元(40)通过翻译存储器扩展规则中的相应规则扩展经过形态分析的输入句子,并且生成翻译存储器匹配扩展格式。 扩展翻译存储器匹配单元(50)将创建的翻译存储器匹配扩展格式的输入句与存储在翻译存储器DB中的扩展句子相匹配。 另外,扩展翻译存储器匹配单元输出与匹配的扩展原始句子对应的翻译结果。
-
公开(公告)号:KR100961717B1
公开(公告)日:2010-06-10
申请号:KR1020080090595
申请日:2008-09-16
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2755 , G06F17/2827 , G06F17/2854
Abstract: 본 발명은 병렬 코퍼스를 이용하여 기계번역 오류를 자동으로 탐지하는 방법 및 장치에 관한 것이다. 즉, 본 발명에서는 병렬 코퍼스를 이용하여 규칙기반의 기계번역시스템의 오류를 자동으로 탐지하고 추적함에 있어, 기계 번역상 발견된 오류를 병렬 코퍼스의 목적언어 문장 즉, 정답 문장을 이용하여 오류 수정이 가능할 뿐만 아니라, 오류 유형을 분류하여 일정한 빈도수 이상의 오류들을 오류 정보로 제공함으로써, 기계번역상 오류를 탐지하는데 소요되는 시간과 노력을 획기적으로 줄일 수 있으며, 시스템 엔지니어가 탐지, 추적된 오류 정보를 통해 기계번역시스템의 성능을 쉽게 개선할 수 있도록 함으로써, 기계번역시스템의 성능 향상 효율을 극대화할 수 있다.
병렬코퍼스, 형태소, 단어, 오류, 탐지, 번역-
公开(公告)号:KR1020100041019A
公开(公告)日:2010-04-22
申请号:KR1020080099995
申请日:2008-10-13
Applicant: 한국전자통신연구원
IPC: G06F17/28
CPC classification number: G06F17/271 , G06F17/2872
Abstract: PURPOSE: A document translation device and a method thereof are provided to improve the translation selection performance through text analysis and to improve the translation accuracy and readability of English documents. CONSTITUTION: A document processing block(102) performs morpheme analysis/tagging about an inputted English document. The document processing block analyzes statistic information. The document processing block outputs a tagging result in which the text analysis information is reflected. A document translation block(104) performs structure analysis/structure conversion about the tagging result outputted from the document processing block. The document translation block outputs a translated document corresponding to the inputted English document.
Abstract translation: 目的:提供文本翻译装置及其方法,通过文本分析提高翻译选择性能,提高英文文本的翻译准确性和可读性。 构成:文档处理块(102)对输入的英文文档执行语素分析/标记。 文档处理块分析统计信息。 文档处理块输出反映文本分析信息的标记结果。 文档翻译块(104)对从文档处理块输出的标记结果执行结构分析/结构转换。 文档翻译块输出与输入的英文文档相对应的翻译文档。
-
95.
公开(公告)号:KR1020090061158A
公开(公告)日:2009-06-16
申请号:KR1020070128041
申请日:2007-12-11
Applicant: 한국전자통신연구원
IPC: G06F17/28
CPC classification number: G06F17/2854 , G06F17/2715 , G06F17/2755
Abstract: A translation error correcting method using error correction patterns in a translation system and an apparatus thereof are provided to improve the translation performance by correcting translation errors in real time. An error correction pattern is constructed through the error correction learning which uses the bilingual corpus including translation correct answer sentences of an object language form for a source language sentence(200). The translation for a specific sentence is performed by using an automatic translator(204). By comparing the translated sentence with the conditional part of the error correction pattern, a translation error is grasped(206). The predicted translation error is corrected and outputted(208,210).
Abstract translation: 提供了使用翻译系统中的纠错模式的翻译错误校正方法及其装置,以通过实时校正翻译错误来提高翻译性能。 通过误差校正学习构建误差校正模式,其使用双语语料库,其包括源语言句子(200)的对象语言形式的翻译正确答案。 通过使用自动翻译器(204)来执行特定句子的翻译。 通过比较翻译后的句子与错误校正模式的条件部分,掌握翻译错误(206)。 校正并输出预测的平移误差(208,210)。
-
公开(公告)号:KR1020090048319A
公开(公告)日:2009-05-13
申请号:KR1020080104184
申请日:2008-10-23
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2755 , G06F17/2264 , G06F17/2785
Abstract: 본 발명은 명사가 여러 게 나열되는 복합 명사 내부의 의미 구조 분석을 통해 의미의 왜곡이 없는 문장 형태로 변환하여, 명사가 나열된 형태에서 생략된 문장 성분을 자동으로 복원하여 의미 왜곡이 없는 문장으로 생성하는 문장 성분 복원 장치 및 그 방법에 관한 것이다. 본 발명에 의해, 분석된 복합 명사의 의미 구조를 바탕으로 의미를 왜곡시키지 않으면서, 다른 형태의 표현을 생성할 수 있게 된다.
-
公开(公告)号:KR1020090015604A
公开(公告)日:2009-02-12
申请号:KR1020070080065
申请日:2007-08-09
Applicant: 한국전자통신연구원
CPC classification number: G06F17/28
Abstract: A method for constructing translation knowledge and an apparatus thereof are provided to minimize time and cost required in obtaining knowledge by automating a whole process of translation knowledge obtaining. A method for constructing translation knowledge comprises the following steps: a step for converting a source language sentence and a target language sentence into a form in which sentence structure information is expressed(S410); a step for encoding a form of the source language and the target language to a native identification number(S420); a step for performing a word arrangement by self-control learning(S430); a step for correcting an arrangement error(S440); a step for performing a sentence structure arrangement with dependency relationship information of the source language and a word arrangement result(S450); and a step for extracting a word/sentence structure knowledge by using a word/sentence structure arrangement result(S460).
Abstract translation: 提供了一种构建翻译知识的方法及其装置,以通过自动化翻译知识获取的整个过程来最小化获得知识所需的时间和成本。 一种用于构建翻译知识的方法包括以下步骤:将源语言句和目标语句转换成表达句子结构信息的形式的步骤(S410); 用于将源语言和目标语言的形式编码为本地标识号的步骤(S420); 通过自我控制学习进行词汇安排的一个步骤(S430); 纠正排列错误的步骤(S440); 执行具有源语言的依赖关系信息和词排列结果的句子结构排列的步骤(S450); 以及通过使用单词/句子结构排列结果来提取单词/句子结构知识的步骤(S460)。
-
98.
公开(公告)号:KR1020080019126A
公开(公告)日:2008-03-03
申请号:KR1020060080921
申请日:2006-08-25
Applicant: 한국전자통신연구원
IPC: G06F17/28
CPC classification number: G06F17/2827
Abstract: A domain-adaptive portable caption machine translation device using dynamic translation resources and a method thereof are provided to improve translation performance for various specialized fields by automatically recognizing a style/field of caption and dynamically forming an optimal translation module and knowledge suitable for a recognition result. A core word extractor(102) extracts a core word for recognizing a style and a field from a caption sentence of a received broadcasting signal. A style/field recognizer(103) recognizes the style/field of the caption sentence based on the extracted core word and various dictionaries. A dynamic translation knowledge former(104) forms translation knowledge dynamically based on the recognized style/field and loads the formed translation knowledge to a dynamic translation database(206). A dynamic translation module former(105) reforms a translation module dynamically based on the recognized style/field. A morpheme analyzer(106) analyzes morphemes of the caption sentence. A style pattern applier(107) performs translation in a sentence unit by applying a style pattern to the caption sentence. A phrase analyzer(108) analyzes phrases of the caption sentence. A pattern-based translation generator(109) generates a pattern-based translation for the caption sentence based on a phrase analysis result.
Abstract translation: 提供了使用动态翻译资源的领域适应性便携式字幕机翻译装置及其方法,以通过自动识别字幕的风格/领域并动态地形成适合于识别结果的最佳翻译模块和知识来改善各种专业领域的翻译性能 。 核心词提取器(102)从接收到的广播信号的标题语句中提取用于识别风格和字段的核心字。 风格/场识别器(103)基于所提取的核心字和各种字典来识别字幕句的风格/字段。 动态翻译知识前者(104)基于识别的样式/字段动态地形成翻译知识,并将形成的翻译知识加载到动态翻译数据库(206)。 动态翻译模块前者(105)基于公认的风格/领域动态地改写翻译模块。 语素分析器(106)分析字幕句子的语素。 风格图案施加器(107)通过对标题语句应用风格模式来执行句子单元中的翻译。 短语分析器(108)分析标题语句的短语。 基于模式的翻译生成器(109)基于短语分析结果生成用于标题语句的基于模式的翻译。
-
公开(公告)号:KR100805191B1
公开(公告)日:2008-02-21
申请号:KR1020060091102
申请日:2006-09-20
Applicant: 한국전자통신연구원
CPC classification number: G06F17/274 , G06F17/2863
Abstract: A method and a device for restoring an ellipsis component in a Korean sentence are provided to generate a correct English translation and improve quality of a translation system by finding an ellipsis component from the Korean sentence and restoring the ellipsis component based on a heuristic rules or a raw corpus. A paragraph recognizer(310) recognizes a start and finish range of an inputted sentence. A paragraph storing part(320) stores the inputted sentence in a declinable word phrase unit based on a paragraph analyzed result of the inputted sentence. An ellipsis recognizer(330) checks whether the declinable word phrase having the ellipsis component to be restored is found from the current sentence. A declinable word comparator(350) compares similarities between declinable word information stored in the paragraph storing part and the current sentence. An antecedent selector(340) checks antecedent candidates for the ellipsis component, determines priority of the antecedent candidates, and determines an antecedent among the antecedent candidate based on a comparison result.
Abstract translation: 提供了一种用于恢复韩语句子中的省略号分量的方法和装置,用于通过从韩语句子中找到省略号分量来产生正确的英文翻译,并提高翻译系统的质量,并根据启发式规则或 原始语料库 段识别器(310)识别输入的句子的开始和结束范围。 段存储部分(320)基于所输入的句子的段落分析结果将输入的句子存储在可拒绝的词组单元中。 省略号识别器(330)检查从当前句子中是否找到具有要恢复的省略号分量的可下降词组短语。 可下降字词比较器(350)比较存储在段落存储部分中的可下降字词信息与当前句子之间的相似性。 前提选择器(340)检查前提候选者的省略号分量,确定先行候选者的优先级,并根据比较结果确定先行候选者中的先行词。
-
公开(公告)号:KR100792204B1
公开(公告)日:2008-01-08
申请号:KR1020060056203
申请日:2006-06-22
Applicant: 한국전자통신연구원
Abstract: 본 발명은 특허 문서를 번역 대상으로 하여 특허 도메인에 특화된(customized) 번역 지식(translation knowledge)을 추출하고 이렇게 추출된 특화된 지식을 사용하여 특허 문서를 자동 번역하는 방법 및 그 장치에 관한 것으로, 특허 문서로부터 전문용어를 대량으로 추출하고 추출된 전문용어에 대하여 대역어를 할당하며, 일반 도메인의 문서가 아닌 특허 문서에서 고빈도로 사용되는 표현들을 추출하고 해당 표현들에 대한 대역 표현을 구축하며, 이렇게 구축된 번역 지식을 사용하고, 또한 특허문서에서의 과대하게 긴 문장들에 대해 문형패턴 적용, 병렬구조 인식 및 구문단서에 의한 문장분할 등을 수행하여, 파싱 가능한 번역 단위를 추출하여 구조분석을 수행하는 특허 문서를 자동으로 번역하는 장치 및 방법을 제공하는데 있다.
기계번역, 자동번역, 지식추출, 특허번역
-
-
-
-
-
-
-
-
-