-
公开(公告)号:KR100886688B1
公开(公告)日:2009-03-04
申请号:KR1020070128563
申请日:2007-12-11
Applicant: 한국전자통신연구원
IPC: G06F17/20
CPC classification number: G06F17/2755 , G06F17/2715 , G06F17/2735 , G06F17/277 , G06F17/2863
Abstract: A method and an apparatus for creating a quantifier of Korean language are provided to generate quantifiers proper to a Korean syntactic structure in a combination word in which a number and a noun is combined when translating sentences through morphological and syntactic analysis in a machine translation. A quantifier extracting unit extracts quantifier information according to the information as to parts of speech for all sentences which constitute a Koran corpus, and a quantifier filtering part(114) filters the quantifier information. A feature value assigning unit(116) assigns only high frequent quantifier information to Korean target words of dictionary database in feature value. A quantifier generating unit(120) generates quantifiers based on the feature value associated with the quantifiers assigned to each target word, and a Korean corpus collecting unit(100) collects the large amount of Korean corpus and databases the collected Korean corpus as source corpus. A Korean morpheme analyzing and tagging unit(104) performs a morpheme analysis and tagging operation for the all sentences which constitutes the corpus and performs a database operation in Korean tagged corpus.
Abstract translation: 提供了一种用于创建韩语的量词的方法和装置,用于在通过机器翻译中的形态和语法分析翻译句子时,以组合词中的数字和名词组合来产生适合韩国语法结构的量词。 量化器提取单元根据构成古兰经语料的所有句子的语音部分的信息提取定量器信息,量化器滤波部分(114)对量化器信息进行滤波。 特征值分配单元(116)在特征值中仅将高频率量词信息分配给词典数据库的韩语目标词。 量化器生成单元(120)基于与分配给每个目标词的量词相关联的特征值生成量词,韩国语料库收集单元(100)收集大量的韩语语料库并将收集的韩语语料库数据库作为源语料库。 韩国语素分析和标签单元(104)对构成语料库的所有句子执行语素分析和标记操作,并在韩语标签语料库中执行数据库操作。
-
公开(公告)号:KR1020110027361A
公开(公告)日:2011-03-16
申请号:KR1020090085422
申请日:2009-09-10
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2836
Abstract: PURPOSE: An automatic translation system based on TM and a method thereof, capable of increasing coverage by TM are provided to increase the quality of translation by changing TM consisting of a character string into a configured TM. CONSTITUTION: A TM building module(106) converts a language pattern into a partial translation pattern and registers the partial translation pattern into TM database. A partial combination translation module(20) analyzes the structure of a language pattern with reference to the TM database and searches the partial translation pattern. The partial combination translation module combines the partial translation pattern and outputs a translation corresponding to an input statement.
Abstract translation: 目的:提供一种基于TM的自动翻译系统及其方法,其能够增加TM的覆盖率,以通过将由字符串组成的TM变更为配置的TM来提高翻译质量。 构成:TM构建模块(106)将语言模式转换为部分翻译模式,并将部分翻译模式注册到TM数据库中。 部分组合翻译模块(20)参考TM数据库分析语言模式的结构,并搜索部分翻译模式。 部分组合翻译模块组合部分翻译模式并输出与输入语句对应的翻译。
-
公开(公告)号:KR100911619B1
公开(公告)日:2009-08-12
申请号:KR1020070128564
申请日:2007-12-11
Applicant: 한국전자통신연구원
IPC: G06F17/28
Abstract: 본 발명은 자동번역을 위한 영어 어휘 패턴을 구축하는데 있어서, 원시 코퍼스(source corpus)로부터 어휘패턴 후보를 자동으로 추출하고, 추출된 어휘패턴 후보에 대해 사람이 어휘패턴을 구축할 수 있도록 지원하여, 적은 노력으로 필요한 어휘패턴을 구축할 수 있도록 하는 자동번역을 위한 영어 어휘패턴 구축 기술에 관한 것이다. 본 발명은 원시 코퍼스에 대해 품사 태깅(tagging)을 수행하는 태깅 단계, 패턴범위 후보인식 단계, 필터링 단계, 패턴 저장 단계, 빈도수 조정 단계, 어휘 패턴 구축 지원 단계로 구성되는 것을 특징으로 한다.
어휘 패턴, 지식 구축, 기계번역, 구문분석-
公开(公告)号:KR1020090066067A
公开(公告)日:2009-06-23
申请号:KR1020070133677
申请日:2007-12-18
Applicant: 한국전자통신연구원
IPC: G06F17/28
CPC classification number: G06F17/2872 , G06F17/2818 , G06F17/2863
Abstract: An automatic Korean/English translating method and an apparatus thereof including an automatic pattern base translating technique are provided to generate final translating result by accurately dividing a Korean sentence. A result of A morphological analysis and a phrase analysis are cut by two or more partial original sentences(S208). A pattern machine half machine translation bilingual document and a statistical machine translation translated sentence are generated based on the divided result(S210, S212). A partial translated sentence about the Korean original sentence is synthesized to one English sentence by using translation result(S218).
Abstract translation: 提供了一种自动的韩文/英文翻译方法及其包括自动图案基本翻译技术的装置,以通过精确地划分韩语句子来产生最终的翻译结果。 A形态分析和短语分析的结果被两个或多个部分原始句子切割(S208)。 基于分割结果生成模式机半机翻译双语文档和统计机器翻译翻译句子(S210,S212)。 通过使用翻译结果将关于韩语原始句子的部分翻译句子合成为一个英文句子(S218)。
-
公开(公告)号:KR1020090061531A
公开(公告)日:2009-06-16
申请号:KR1020070128564
申请日:2007-12-11
Applicant: 한국전자통신연구원
IPC: G06F17/28
CPC classification number: G06F17/277 , G06F17/218 , G06F17/2715
Abstract: A method for constructing English vocabulary patterns in an automatic translation system and an apparatus thereof are provided to increase the performance of sentence structure analysis/automatic translation by utilizing the vocabulary patterns in the automatic translation. The tagging for part of speech is performed for inputted corpuses(S202). By using the tagged part of speech and the original form of words, pattern range candidates which can become a vocabulary pattern are recognized(S204). The filtering is performed for the extracted pattern(S206). A pattern generated through the filtering process is stored together with frequency information(S208). The frequency information is adjusted(S210). The final vocabulary pattern candidates are extracted(S212).
Abstract translation: 提供了一种在自动翻译系统中构建英语词汇模式的方法及其装置,通过利用自动翻译中的词汇模式来提高句子结构分析/自动翻译的性能。 针对输入的语料库执行部分语音的标记(S202)。 通过使用标记的语音部分和原始形式的单词,可以识别出可以成为词汇模式的模式范围候选(S204)。 对所提取的图案进行滤波(S206)。 通过滤波处理产生的图案与频率信息一起存储(S208)。 调整频率信息(S210)。 提取最终的词汇模式候选(S212)。
-
公开(公告)号:KR1020090025137A
公开(公告)日:2009-03-10
申请号:KR1020080066395
申请日:2008-07-09
Applicant: 한국전자통신연구원
IPC: G06F17/28
Abstract: A real-time interactive machine translation apparatus and a method thereof are provided to estimate the translation error based on information generated during the translation process, and offer the re-translated result in which the error is modified by a user in real time. A machine translation engine(210) comprises a morphological/syntactic analyzer(211) and a translation generator(212). The morphological/syntactic analyzer analyzes the morpheme and syntax of the original, and the translation generator produces a translation based on the analyzed result. An original text error estimator(220) receives the morpheme and sentence analysis result of the original from the machine translation engine, and determines an original text error estimated portion having the possibility of translation error within the original text. The translation error estimator(230) receives the generated translation information from the machine translation engine and determines a translation error estimated portion having the possibility of translation error within the translation.
Abstract translation: 提供实时交互式机器翻译装置及其方法,以基于翻译过程中产生的信息来估计翻译错误,并提供用户实时修改错误的重新翻译结果。 机器翻译引擎(210)包括形态/句法分析器(211)和翻译生成器(212)。 形态/句法分析器分析原文的语素和语法,翻译生成器根据分析结果生成翻译。 原始文本误差估计器(220)从机器翻译引擎接收原稿的语素和句子分析结果,并确定原始文本中具有翻译错误可能性的原始文本错误估计部分。 翻译误差估计器(230)从机器翻译引擎接收所生成的翻译信息,并确定在翻译内具有翻译错误可能性的翻译错误估计部分。
-
公开(公告)号:KR101120038B1
公开(公告)日:2012-03-23
申请号:KR1020080131776
申请日:2008-12-22
Applicant: 한국전자통신연구원
Abstract: 본 발명은 주제를 대표할 수 있는 신조어인지 여부에 따라 우선순위를 결정하여 신조어를 선정한다는 것으로, 이를 위하여 본 발명은, 다양한 유형에 따른 신조어를 모두 추출하거나 전체 말뭉치를 이용하여 신조어를 선정하거나 선정된 신조어 후보를 사람이 직접 일일이 검토하여 신조어를 선정하는 종래 방법과는 달리, 신조어 후보에 대한 키워드를 추출하고, 추출된 키워드에 대한 주제를 탐지 및 추적한 후 그 주제의 대표어가 될 수 있는지 여부에 따라 우선 순위를 결정한 후에, 결정된 우선 순위에 따라 신조어를 선정함으로써, 신조어 선정을 효과적으로 수행할 수 있는 것이다.
자동 번역 시스템, 신조어(neologism)-
公开(公告)号:KR101092361B1
公开(公告)日:2011-12-09
申请号:KR1020080131775
申请日:2008-12-22
Applicant: 한국전자통신연구원
Abstract: 본발명은목표언어가중국어인자동번역시스템에서의대역어생성기법에관한것으로, 통계기반의의미모호성을해소하거나구문변환으로는정확한번역이어려운상황에서, 중국어부사생성을위하여다중부사변환패턴, 부사-용언변환패턴, 중국어부사부정형위치사전및 중국어복합동사사전과같은패턴과지식사전을활용하여부사의생성위치에따른대역어를결정함으로써, 목표언어가중국어인자동번역시스템에서중국어부사에대응하는대역어를효과적으로생성할수 있는것이다.
-
公开(公告)号:KR100975044B1
公开(公告)日:2010-08-11
申请号:KR1020080104184
申请日:2008-10-23
Applicant: 한국전자통신연구원
Abstract: 본 발명은 명사가 여러 게 나열되는 복합 명사 내부의 의미 구조 분석을 통해 의미의 왜곡이 없는 문장 형태로 변환하여, 명사가 나열된 형태에서 생략된 문장 성분을 자동으로 복원하여 의미 왜곡이 없는 문장으로 생성하는 문장 성분 복원 장치 및 그 방법에 관한 것이다. 본 발명에 의해, 분석된 복합 명사의 의미 구조를 바탕으로 의미를 왜곡시키지 않으면서, 다른 형태의 표현을 생성할 수 있게 된다.
-
公开(公告)号:KR1020100062826A
公开(公告)日:2010-06-10
申请号:KR1020090026452
申请日:2009-03-27
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2836 , G06F17/2755
Abstract: PURPOSE: A translation memory apply method for auto translation and an apparatus thereof are provided to perform automatic translation by matching an extended input sentence of a translation memory matching extension format with extended original sentences stored at an extension translation memory DB. CONSTITUTION: An extension unit(40) extends an input sentence, which goes via a morphological analysis, through a corresponding rule among translation memory extension rules, and generates a translation memory matching extension format. An extension translation memory matching unit(50) matches the input sentence of the created translation memory matching extension format with extended sentences stored at the translation memory DB. In addition, the extension translation memory matching unit outputs the translation results corresponding to the matched extended original sentences.
Abstract translation: 目的:一种用于自动翻译的翻译记忆库应用方法,并且提供一种装置,用于通过将翻译记忆体匹配扩展格式的扩展输入句与扩展翻译存储器DB中存储的扩展原始句子相匹配来执行自动翻译。 构成:扩展单元(40)通过翻译存储器扩展规则中的相应规则扩展经过形态分析的输入句子,并且生成翻译存储器匹配扩展格式。 扩展翻译存储器匹配单元(50)将创建的翻译存储器匹配扩展格式的输入句与存储在翻译存储器DB中的扩展句子相匹配。 另外,扩展翻译存储器匹配单元输出与匹配的扩展原始句子对应的翻译结果。
-
-
-
-
-
-
-
-
-