구문 분석 방법 및 그 장치
    31.
    发明公开
    구문 분석 방법 및 그 장치 有权
    协同分析方法及其设备

    公开(公告)号:KR1020100069119A

    公开(公告)日:2010-06-24

    申请号:KR1020080127709

    申请日:2008-12-16

    CPC classification number: G06F17/271 G06F17/2755

    Abstract: PURPOSE: A syntax analyzing method and a device thereof are provided to prevent creation of a chart or adjust chart weight by being matched previously constructed constraint condition. CONSTITUTION: A part-of-speech tagger(10) performs part of speech tagging about an original. A syntax information generator(20) generates structure syntax information about the tagging result. A chart parser(30) uses a chart about the morpheme sentence structure information as a default inactive chart, repeats rule matching and active and inactive chart generation, and performs bottom-up chart parsing. A node syntactic information generator(40) generates node syntactic information according to parsing result. A constraint condition application unit(50) applies a constraint condition according to the chart parsing result.

    Abstract translation: 目的:提供语法分析方法及其装置,以防止通过匹配先前构造的约束条件来创建图表或调整图表权重。 构成:词性标签(10)执行关于原件的词性标签。 语法信息生成器(20)生成关于标记结果的结构语法信息。 图表解析器(30)使用关于语素句子结构信息的图表作为默认非活动图表,重复规则匹配和主动和非活动图表生成,并执行自下而上的图表解析。 节点句法信息生成器(40)根据解析结果生成节点句法信息。 约束条件应用单元(50)根据图解析结果应用约束条件。

    실시간 대화식 기계 번역 장치 및 방법
    32.
    发明授权
    실시간 대화식 기계 번역 장치 및 방법 有权
    实时交互式机器翻译的设备与方法

    公开(公告)号:KR100958340B1

    公开(公告)日:2010-05-17

    申请号:KR1020080066395

    申请日:2008-07-09

    Abstract: 본 발명은 사용자의 개입을 통해 번역의 품질을 향상시키는 대화식 기계 번역 장치에 관한 것으로서, 특히 번역 과정에서 생성된 정보에 기반하여 번역 오류를 추정하고 사용자의 수정에 따른 재번역 결과를 실시간으로 제공하는 실시간 대화식 기계 번역 장치 및 방법에 관한 것이다. 본 발명에 따른 대화식 기계 번역 장치는 원문의 형태소 및 구문을 분석하여 원문 분석 정보를 생성하는 형태소/구문 분석기 및 상기 원문 분석 정보에 기반하여 번역문 및 번역문 생성 정보를 생성하는 번역문 생성기를 구비하는 기계 번역 엔진 및 상기 원문 분석 정보 및 상기 번역문 생성 정보에 기반하여 상기 원문 및 상기 번역문의 문장 구조 및 대응관계를 사용자에게 표시하고 상기 사용자로부터 상기 원문 또는 상기 번역문에 대한 수정사항을 입력받는 사용자 인터페이스 모듈로 구성된다. 본 발명은 사용자가 오번역이 발생한 부분 및 원인을 효과적으로 식별하고 수정할 수 있는 사용자 인터페이스를 제공하고 수정에 따른 재번역의 결과를 신속히 제공함으로써, 사용자가 만족할 수 있는 고품질의 번역을 수행할 수 있다.
    기계 번역, 사용자 개입, 대화식 기계 번역, IMT

    병렬 코퍼스를 이용한 기계번역 오류 탐지 방법 및 장치
    33.
    发明公开
    병렬 코퍼스를 이용한 기계번역 오류 탐지 방법 및 장치 有权
    使用并行机器检测机器翻译错误的方法和装置

    公开(公告)号:KR1020100031800A

    公开(公告)日:2010-03-25

    申请号:KR1020080090595

    申请日:2008-09-16

    CPC classification number: G06F17/2755 G06F17/2827 G06F17/2854

    Abstract: PURPOSE: A machine translation error detection method using the parallel corpus and an apparatus thereof are provided so that by providing an error statistics information classified as for each type the reading mistake generating in the machine translation system of the rule base is detected. The performance of the machine translation system is improved. CONSTITUTION: A part of analyzing morpheme(104) analyzes the morpheme of the purpose language sentence interpreted by machine with the purpose language sentence of the parallel corpus corresponding to the primitive language sentence. It classifies into the word by word. A word by word sorter(106) stands in line the group of the purpose language sentence interpreted by machine and primitive language sentence and the group of the purpose language sentence of the primitive language sentence and parallel corpus to the word by word. It decodes. An error detection part(108) detects error through the comparison of the word by word of the decoded sentences as described above from the purpose language sentence interpreted by machine. It classifies error and the error category and performance analysis part(110) inspect the error pattern ratio. Error data is produced.

    Abstract translation: 目的:提供使用平行语料库的机器翻译错误检测方法及其装置,通过提供针对每种类型分类的错误统计信息,检测规则库的机器翻译系统中的读取错误。 改进了机器翻译系统的性能。 构成:分析语素的一部分(104)分析机器解释的目的语言句子与原语言句子对应的平行语料库目的语句的语素。 它逐字分类。 一个单词分拣机(106)与机器和原语言句子解释的目的语言句子的组和原语语句的目的语言句子组和平行语料库组合在一起。 它解码 错误检测部分(108)通过如上所述的解码语句逐字从机器解释的目的语句来检测错误。 它对错误进行分类,错误类别和性能分析部分(110)检查错误模式比率。 产生错误数据。

    다단계 용언구 패턴을 적용한 번역장치와 이를 위한적용방법 및 추출방법
    34.
    发明公开
    다단계 용언구 패턴을 적용한 번역장치와 이를 위한적용방법 및 추출방법 有权
    使用多级VERB图案的翻译装置及其应用和提取方法

    公开(公告)号:KR1020100025885A

    公开(公告)日:2010-03-10

    申请号:KR1020080084626

    申请日:2008-08-28

    CPC classification number: G06F17/2827 G06F17/2775

    Abstract: PURPOSE: A translation device in which a multi-level verb pattern is applied and an application method and extraction method thereof are provided to improve translating performance by applying a matching method of the multi-level verb pattern. CONSTITUTION: A default verb pattern matching unit(305) advances the matching by applying a semantic code to the default verb pattern through a default verb pattern DB(313) when a basic verb pattern is non-matched. A default word order matching unit(307) advances the matching through a default word order verb pattern DB(315) when the default verb pattern is non-matched. A default investigation matching unit(309) outputs a bilingual document by applying the semantic code to a default investigation pattern through a default investigation DB(317) when the default word order verb pattern is non-matched.

    Abstract translation: 目的:应用多级动词模式的匹配方法,提供应用多级动词模式的翻译装置及其应用方法及其提取方法,以提高翻译性能。 构成:当基本动词模式不匹配时,默认动词模式匹配单元(305)通过默认动词模式DB(313)将语义代码应用于默认动词模式来推进匹配。 当默认动词模式不匹配时,默认单词顺序匹配单元(307)通过默认单词顺序动词模式DB(315)推进匹配。 默认调查匹配单元(309)通过默认调查DB(317)将语义代码应用于默认调查模式时输出双语文档,当默认单词顺序动词模式不匹配时。

    PDF 파일을 대상으로 하는 자동 번역 방법
    35.
    发明授权
    PDF 파일을 대상으로 하는 자동 번역 방법 有权
    PDF文件的机器翻译方法

    公开(公告)号:KR100912502B1

    公开(公告)日:2009-08-17

    申请号:KR1020070075581

    申请日:2007-07-27

    CPC classification number: G06F17/2247 G06F17/211 G06F17/2809

    Abstract: 본 발명은 PDF 파일을 대상으로 하는 자동 번역 방법에 관한 것이다.
    본 발명에 따르면, 자동 번역 장치는 입력되는 원시언어 PDF 파일로부터 이미지 변환을 통해 원시언어 텍스트 및 비텍스트를 추출하며, 추출된 원시언어 텍스트를 텍스트 정보로부터 추출한 원시언어 텍스트를 이용해 교정한다. 또한, 추출된 원시언어 텍스트 중에서 비텍스트 등에 의해 문맥적으로 분리된 부분을 복원하고, 원시언어 PDF 파일의 문맥적 흐름에 맞도록 추출된 텍스트 및 비텍스트를 재정렬하여 원시언어 XML/HTML 파일을 생성한다. 이후, 원시언어 XML/HTML 파일의 태그로부터 원시언어 텍스트를 분리한 뒤, 원시언어 PDF 파일에 해당하는 기술 분야에 특화된 번역 지식 및 변환 엔진을 이용하여 목적언어 텍스트를 생성한다. 이렇게 번역된 목적언어 텍스트는 원시언어 텍스트 대신 XML/HTML 파일에 삽입되고, 이에 따라 생성된 목적언어 XML/HTML 파일은 다시 목적언어 PDF 파일로 변환되어 출력된다.
    자동 번역, PDF, 기술 도메인, 기술 논문

    번역 시스템에서 오류 보정 패턴을 이용한 번역 오류 수정 방법 및 장치
    36.
    发明授权
    번역 시스템에서 오류 보정 패턴을 이용한 번역 오류 수정 방법 및 장치 失效
    通过在翻译系统中使用错误校正模式来校正翻译错误的方法和装置

    公开(公告)号:KR100911834B1

    公开(公告)日:2009-08-13

    申请号:KR1020070128041

    申请日:2007-12-11

    Abstract: 본 발명은 번역 시스템에서 오류 보정 패턴을 이용한 번역 오류 수정 기술에 관한 것으로, 원시언어 문장에 대한 목적언어 형태의 번역 정답 문장들을 포함하는 병렬 코퍼스를 이용한 오류 보정 학습을 통하여 오류 보정 패턴을 구축하고, 자동번역기를 이용하여 특정 문장에 대한 번역을 수행하고, 번역된 문장에 대해 오류 보정 패턴의 조건부와 비교하여 번역 오류를 파악하며, 추정된 번역 오류를 오류 보정 패턴의 행위부에 따라 수정하고, 오류 보정된 번역 문장을 출력하는 것을 특징으로 한다. 본 발명에 의하면, 비문이나 자연스럽지 못한 표현 등과 같은 자동 번역 시스템의 번역 오류를 실시간으로 보정함으로써, 자동 번역 시스템의 번역 성능을 향상시킬 수 있다.
    자동 번역 시스템, 자동 번역 후처리, 오류보정 패턴

    통계적 기계번역 시스템에서 단어 및 구문들간의 번역관계를 자율적으로 학습하기 위한 장치 및 그 방법
    37.
    发明授权
    통계적 기계번역 시스템에서 단어 및 구문들간의 번역관계를 자율적으로 학습하기 위한 장치 및 그 방법 失效
    统计机器翻译系统中单词和短语之间无监督学习翻译关系的装置和方法

    公开(公告)号:KR100911372B1

    公开(公告)日:2009-08-10

    申请号:KR1020070076140

    申请日:2007-07-30

    Abstract: 본 발명에 따른, 통계적 기계번역 시스템에서 단어 및 구문들간의 번역 관계를 자율적으로 학습하기 위한 장치는 형태소-구문 분석된 소스 언어 문장을 수신하고, 상기 형태-구문 분석된 소스 언어 문장을 형태-구문적 특징 정보를 부착한 토큰화된 소스 언어 문장으로 변화시키는 소스 언어 문장 전처리기와, 형태소-구문 분석된 타겟 언어 문장을 수신하고, 상기 형태-구문 분석된 타겟 언어 문장을 형태-구문적 특징 정보를 부착한 토큰화된 타겟 언어 문장으로 변화시키는 타겟 언어 문장 전처리기와, 상기 토큰화된 소스 언어 문장 및 상기 토큰화된 타겟 언어 문장을 수신하여, 상기 토큰화된 소스 언어 문장 및 상기 토큰화된 타겟 언어 문장쌍에 대한 단어 정렬 및 구문 정렬을 수행하는 자율 학습기와, 상기 자율 학습기의 상기 단어 정렬 및 구문 정렬 수행을 반복시키기 위한 학습 종료 조건 검사기를 포함한다.
    형태-구문 특징 정보, 단어 정렬, 구문 정렬, 반복 자율 학습, 단어 대역 사전, 구문 대역 사전

    PDF 파일을 대상으로 하는 자동 번역 방법
    38.
    发明公开
    PDF 파일을 대상으로 하는 자동 번역 방법 有权
    PDF文件的机器翻译方法

    公开(公告)号:KR1020090011712A

    公开(公告)日:2009-02-02

    申请号:KR1020070075581

    申请日:2007-07-27

    CPC classification number: G06F17/2247 G06F17/211 G06F17/2809

    Abstract: A method for automatically translation based on a PDF(Portable Document Format) is provided to lower error occurring in a text extracting process by performing the translation with translation knowledge and a transformation pattern, which are specialized to a description domain of a source language PDF file. A text extractor extracts source language text, non-text, and text information(S101). A paragraph recovery unit generates a source language XML(eXensible Markup Language)/HTML(HyperText Markup Language) by combining/recovering grammatically separated source language text, and rearranging the recovered source language text and the non-text according to syntax flow of a source language PDF file(S102). An XML/HTML processor separates the source language text from a tag of the source language XML/HTML file, and outputs/translates the source language text by using translation knowledge and a translation engine specialized to a technical field(S103). Target language text is inserted into the tag of the XML/HTML file through the XML/HTML processor instead of the source language text(S104). A PDF file transformer transforms a target language XML/HTML file into a target language PDF file(S105).

    Abstract translation: 提供了一种基于PDF(便携式文件格式)自动翻译的方法,用于通过使用专门针对源语言PDF文件的描述域的翻译知识和转换模式执行翻译来降低文本提取过程中发生的错误 。 文本提取器提取源语言文本,非文本和文本信息(S101)。 段落恢复单元通过组合/恢复语法分离的源语言文本生成源语言XML(可扩展标记语言)/ HTML(超文本标记语言),并根据源的语法流重新排列恢复的源语言文本和非文本 语言PDF文件(S102)。 XML / HTML处理器将源语言文本与源语言XML / HTML文件的标签分离,并使用专业于技术领域的翻译知识和翻译引擎输出/翻译源语言文本(S103)。 目标语言文本通过XML / HTML处理器而不是源语言文本插入到XML / HTML文件的标签中(S104)。 PDF文件变换器将目标语言XML / HTML文件转换为目标语言PDF文件(S105)。

    통계적 기계번역 시스템에서 단어 및 구문들간의 번역관계를 자율적으로 학습하기 위한 장치 및 그 방법
    39.
    发明公开
    통계적 기계번역 시스템에서 단어 및 구문들간의 번역관계를 자율적으로 학습하기 위한 장치 및 그 방법 失效
    统计机器翻译系统中的词语和词汇不一致学习翻译关系的设备和方法

    公开(公告)号:KR1020080052282A

    公开(公告)日:2008-06-11

    申请号:KR1020070076140

    申请日:2007-07-30

    CPC classification number: G06F17/2818 G06F17/289

    Abstract: An apparatus and a method for autonomously learning translation relationships among words and phrases in a statistical machine translation system are provided to enhance correctness in arranging phrases by using unified results of arranging multiple words arrangement and a result of arranging commonly identical words. An apparatus for autonomously learning translation relationships among words and phrases includes a source language sentence preprocessor(101), a target language sentence preprocessor(102), an autonomous learning device(200), a learning terminating condition inspecting unit(210), a statistical machine translation model parameter extracting unit(300), and a decoder. The source language sentence preprocessor receives a sentence written in a source language whose morpheme and phrase are analyzed. The target language sentence preprocessor receives a sentence written in a target language whose morpheme and phrase are analyzed. The autonomous learning device receives learning sets from the source language sentence preprocessor and the target language sentence preprocessor. The learning terminating condition inspecting unit repeats word arrangement, word rearrangement, phrase arrangement, and word & phrase translation dictionary acquisition until a learning termination condition that there is no more change in the word & phrase translation dictionary is satisfied. The statistical machine translation model parameter extracting unit extracts parameters for a statistics based translation model from a word & phrase arrangement result acquired from learning the word & phrase arrangement. The decoder uses the statistical machine translation model for generating a sentence written in a target language from a sentence written in a source language inputted together with a learned language model(400).

    Abstract translation: 提供了一种用于在统计机器翻译系统中自主学习单词和短语之间的翻译关系的装置和方法,以通过使用排列多个单词排列的统一结果和排列通常相同的单词的结果来提高排列短语的正确性。 一种用于自主学习单词和短语之间的翻译关系的装置包括源语言预处理器(101),目标语言句子预处理器(102),自主学习设备(200),学习终止条件检查单元(210),统计 机器翻译模型参数提取单元(300)和解码器。 源语句预处理器接收用语言编写的句子,分析其语素和短语。 目标语言句子预处理器接收以目标语言编写的句子,分析其语素和短语。 自主学习装置从源语言预处理器和目标语言句预处理器接收学习集。 学习终止条件检查单元重复单词排列,单词重排,短语排列以及单词和短语翻译字典获取,直到满足词和短语翻译字典中没有更多变化的学习终止条件。 统计机器翻译模型参数提取单元从学习单词和短语排列获得的单词和短语排列结果提取基于统计的翻译模型的参数。 解码器使用统计机器翻译模型,用于从与学习语言模型(400)一起输入的源语言中写入的句子中生成用目标语言编写的句子。

    문서정보 학습기반 통계적 HMM 품사 태깅 장치 및 그 방법
    40.
    发明授权
    문서정보 학습기반 통계적 HMM 품사 태깅 장치 및 그 방법 有权
    用于基于文本学习的统计HMM的装置语音标签及其方法

    公开(公告)号:KR101250900B1

    公开(公告)日:2013-04-04

    申请号:KR1020090075778

    申请日:2009-08-17

    Abstract: 본 발명은 문서정보 학습기반 통계적 HMM 품사 태깅 장치 및 그 방법에 관한 것으로, 입력되는 문서에 따라 달라지는 문맥 확률, 어휘 확률과 태깅 오류 수정 규칙을 실시간으로 추출하여 품사 태깅하고자 하는 입력 문서의 장르와 도메인에 의존적인 확률 정보와 수정 규칙 등을 추출할 수 있다. 또한, 본 발명은 기학습된 코퍼스에서 나타나지 않는 다양한 장르나 도메인의 문서에 대해서도 실시간으로 입력 문서에서 학습된 정보를 사용함으로써, 다양한 장르나 도메인의 문서에 대한 태깅 정확성을 높일 수 있으며, 문서에 대한 언어적 분석을 필요로 하는 자동번역 및 정보검색 등의 시스템에서 언어분석 정확도를 향상시켜 전체 번역 성능 및 정확성을 향상시킬 수 있다.
    형태소, 품사 태깅, HMM, 학습 기반

Patent Agency Ranking