통계적 기계번역 시스템에서 단어 및 구문들간의 번역관계를 자율적으로 학습하기 위한 장치 및 그 방법
    191.
    发明公开
    통계적 기계번역 시스템에서 단어 및 구문들간의 번역관계를 자율적으로 학습하기 위한 장치 및 그 방법 失效
    统计机器翻译系统中的词语和词汇不一致学习翻译关系的设备和方法

    公开(公告)号:KR1020080052282A

    公开(公告)日:2008-06-11

    申请号:KR1020070076140

    申请日:2007-07-30

    CPC classification number: G06F17/2818 G06F17/289

    Abstract: An apparatus and a method for autonomously learning translation relationships among words and phrases in a statistical machine translation system are provided to enhance correctness in arranging phrases by using unified results of arranging multiple words arrangement and a result of arranging commonly identical words. An apparatus for autonomously learning translation relationships among words and phrases includes a source language sentence preprocessor(101), a target language sentence preprocessor(102), an autonomous learning device(200), a learning terminating condition inspecting unit(210), a statistical machine translation model parameter extracting unit(300), and a decoder. The source language sentence preprocessor receives a sentence written in a source language whose morpheme and phrase are analyzed. The target language sentence preprocessor receives a sentence written in a target language whose morpheme and phrase are analyzed. The autonomous learning device receives learning sets from the source language sentence preprocessor and the target language sentence preprocessor. The learning terminating condition inspecting unit repeats word arrangement, word rearrangement, phrase arrangement, and word & phrase translation dictionary acquisition until a learning termination condition that there is no more change in the word & phrase translation dictionary is satisfied. The statistical machine translation model parameter extracting unit extracts parameters for a statistics based translation model from a word & phrase arrangement result acquired from learning the word & phrase arrangement. The decoder uses the statistical machine translation model for generating a sentence written in a target language from a sentence written in a source language inputted together with a learned language model(400).

    Abstract translation: 提供了一种用于在统计机器翻译系统中自主学习单词和短语之间的翻译关系的装置和方法,以通过使用排列多个单词排列的统一结果和排列通常相同的单词的结果来提高排列短语的正确性。 一种用于自主学习单词和短语之间的翻译关系的装置包括源语言预处理器(101),目标语言句子预处理器(102),自主学习设备(200),学习终止条件检查单元(210),统计 机器翻译模型参数提取单元(300)和解码器。 源语句预处理器接收用语言编写的句子,分析其语素和短语。 目标语言句子预处理器接收以目标语言编写的句子,分析其语素和短语。 自主学习装置从源语言预处理器和目标语言句预处理器接收学习集。 学习终止条件检查单元重复单词排列,单词重排,短语排列以及单词和短语翻译字典获取,直到满足词和短语翻译字典中没有更多变化的学习终止条件。 统计机器翻译模型参数提取单元从学习单词和短语排列获得的单词和短语排列结果提取基于统计的翻译模型的参数。 解码器使用统计机器翻译模型,用于从与学习语言模型(400)一起输入的源语言中写入的句子中生成用目标语言编写的句子。

    번역 시스템 및 번역 서비스 제공방법
    192.
    发明授权
    번역 시스템 및 번역 서비스 제공방법 有权
    用于语言翻译的系统和提供语言翻译服务的方法

    公开(公告)号:KR100834549B1

    公开(公告)日:2008-06-02

    申请号:KR1020060101934

    申请日:2006-10-19

    CPC classification number: G06F17/289

    Abstract: 본원 발명의 번역 시스템은 원문의 오류 유무를 판단하는 기준이 되는 원문 작성 가이드라인, 상기 원문이 상기 원문 작성 가이드라인을 만족하는지 여부를 판단하는 원문 컨트롤러, 기본 사전 및 복수 개의 사용자 사전 중 적어도 하나를 참조하여 상기 원문을 번역하는 번역 엔진을 포함하는 번역 서버와, 원문을 입력받아 상기 번역 서버로 전송하는 원문 처리부, 상기 번역 서버로부터 수신된 번역문을 출력하고 해당 번역문의 승인 여부 결과를 번역 서버로 전송하는 번역문 처리부 및 상기 사용자 사전의 내용을 수정하는 사용자 사전 편집부를 포함하는 사용자 인터페이스와, 원문 작성 방법 공유 데이터베이스 및 사용자 사전 공유 데이터베이스를 포함하는 사용자 커뮤니티 서버를 포함하는 것을 특징으로 한다.
    번역 서버, 원문 작성 가이드 라인, 사용자 사전, 웹 2.0, 태그

    번역 시스템 및 번역 서비스 제공방법
    193.
    发明公开
    번역 시스템 및 번역 서비스 제공방법 有权
    用于语言翻译的系统和提供语言翻译服务的方法

    公开(公告)号:KR1020080035346A

    公开(公告)日:2008-04-23

    申请号:KR1020060101934

    申请日:2006-10-19

    CPC classification number: G06F17/289

    Abstract: A translation system and a translation service method are provided to enhance reliability by correcting errors in an original document and to generate a translated version suitable for semantics in the original document by registering plural user dictionaries which can be edited at the user's inclination. A translation system comprises a translation server(110), a user interface and a user community server(130). The translation server includes an original document construction guideline(112) which is a criterion for determining whether the original document has errors, an original document controller(111) which determines whether the original document satisfies the guideline and a translation engine(114) which translates the original document by referring to a basic dictionary and plural dictionaries of a user's own editing. The user interface includes an original document processor(102) which receives the original document and transmits the received original document to the translation server, a translation version processor(104) which outputs a translation version received from the translation server and transmits an authentication result to the translation server, and a user dictionary editor(106) which enables a user to modify content of the user dictionary. The user community server includes an original document method sharing database(132) and a user dictionary sharing database(134).

    Abstract translation: 提供翻译系统和翻译服务方法以通过修正原始文档中的错误来增强可靠性,并通过登记可以用户倾向编辑的多个用户词典来生成适合于原始文档中的语义的翻译版本。 翻译系统包括翻译服务器(110),用户界面和用户社区服务器(130)。 翻译服务器包括作为确定原始文档是否具有错误的标准的原始文档构造准则(112),确定原始文档是否满足指南的原始文档控制器(111)以及翻译引擎(114) 原始文件通过参考基本词典和用户自己编辑的复数词典。 用户接口包括原始文档处理器(102),其接收原始文档并将接收到的原始文档发送到翻译服务器;翻译版本处理器(104),其输出从翻译服务器接收到的翻译版本,并将认证结果发送到 翻译服务器和用户字典编辑器(106),其使用户能够修改用户字典的内容。 用户社区服务器包括原始文档方法共享数据库(132)和用户字典共享数据库(134)。

    하이픈 포함 미등록어의 대역어 선택 방법 및 장치
    194.
    发明授权
    하이픈 포함 미등록어의 대역어 선택 방법 및 장치 失效
    用于选择字母变量的方法和装置

    公开(公告)号:KR100716158B1

    公开(公告)日:2007-05-10

    申请号:KR1020050120412

    申请日:2005-12-09

    Abstract: 본 발명은 기존의 번역 사전 및 번역 패턴을 효율적으로 활용하여 영어 코퍼스에서 추출된 하이픈 포함 미등록어에 대한 대역어를 자동으로 선택할 수 있는 방법 및 장치에 관한 것으로, 영어 코퍼스에서 하이픈 포함 단어들을 추출할 때 스펠링 오류 제거 및 기구축된 단일어/복합어 사전과의 비교를 통해 미등록어의 수를 줄이는 한편, 단어 번역 패턴을 참조하여 하이픈 포함 미등록어에 대한 대역어를 자동으로 선택하는 것을 특징으로 한다.
    본 발명에 따르면, 스펠링 오류 교정 및 기구축된 단일어/복합어 사전의 엔트리들과의 비교를 통해 미등록어의 수를 줄일 수 있으므로, 종래의 대역어 선택 방법에 비해 하이픈 포함 미등록어에 대한 대역어 선택을 신속하고 정확하게 수행할 수 있으며, 번역 패턴 생성 및 수정을 통해 하이픈 포함 미등록어의 대역어를 보다 신속하고 정확하게 선택할 수 있으므로 이에 따라 자동번역 시스템의 점진적인 성능 향상이 가능하다.
    미등록어, 하이픈, 번역패턴

    Abstract translation: 本发明还涉及一种方法,并且可以自动地选择上连字符的译词,包括英语语料库和有效地利用现有的翻译词典和翻译模式的衍生未登记的单词的装置,提取连字符包括在英语语料库字 因为它相较于除去拼写错误和单语/化合物预先构建的机器,以减少未登记单词的数量,同时参照其特征在于字翻译模式自动选择未注册的单词的译词包含一个连字符。

    전문 분야의 부분 대역 패턴 데이터베이스 자동 구축 장치및 그 방법
    195.
    发明授权
    전문 분야의 부분 대역 패턴 데이터베이스 자동 구축 장치및 그 방법 失效
    用于自动构建技术领域中的动词模式DB的装置及其方法

    公开(公告)号:KR100687734B1

    公开(公告)日:2007-02-27

    申请号:KR1020050017658

    申请日:2005-03-03

    Abstract: 본 발명에 의한 전문 분야의 부분 대역 패턴 데이터베이스 자동 구축 장치 및 방법은 용언 대역어와 조사 대역어 선택을 위한 어휘/의미 공기 정보를 구축하는 단계; 텍스트 말뭉치에 대하여 국소단문을 생성하는 단계; 상기 국소 단문에 대하여 부분 대역 패턴 후보를 생성하는 단계; 상기 어휘/의미 공기 정보를 기초로 상기 부분 대역 패턴 후보에 대한 목적언어 대역 표현을 생성하여 저장하는 단계;를 포함하는 것을 특징으로 하며, 구축된 전문 분야별 부분 대역 패턴 데이터베이스를 활용하여 기술 매뉴얼, 특허 문서 등의 기술 문서 자동번역에 중요한 언어 자원으로써 직접 활용할 수 있다.
    전문 분야, 부분 대역 패턴 데이터베이스

    한국어 특성을 이용한 용언간 구조 분석 방법 및 그 장치
    196.
    发明公开
    한국어 특성을 이용한 용언간 구조 분석 방법 및 그 장치 失效
    使用韩国特征的预测之间的依赖性分析方法及其设备

    公开(公告)号:KR1020060064447A

    公开(公告)日:2006-06-13

    申请号:KR1020050020794

    申请日:2005-03-12

    CPC classification number: G06F17/2755

    Abstract: 본 발명에 의한 한국어 특성을 이용한 용언간 공기패턴에 기반한 한국어 구조분석 방법 및 그 장치는 대량의 말뭉치(corpus)로부터 연속 용언간 공기(co-occurrence)패턴을 추출하는 단계; 입력문에 대하여 형태소 분석을 수행하는 단계; 및 상기 형태소 분석 결과와 상기 용언간 공기패턴을 기초로 상기 입력문의 용언간 구조를 분석하는 단계;를 포함하는 것을 특징으로 하며, 대량의 말뭉치로부터 용언간 공기패턴을 추출할 때 나타나는 잘못된 공기패턴을 최소화할 수 있으며, 또한 연속된 용언의 경우, 구축된 공기패턴을 이용함으로써 용언간 구조분석을 수행하여 구문분석의 성능을 향상시키고, 불연속 용언의 경우, 연속된 용언간 분석을 위해 적용되는 공기패턴과, 불연속 용언을 위해 구축된 격성분 정보 및 관형형의 피수식어 정보에 대해 구축된 데이터를 적용함으로써, 기존에는 해결할 수 없었던 용언간 구조분석의 수행이 가능하게 됨으로써 구문분석의 성능을 향상시킬 수 있다.
    용언, 구조분석

    규칙 기반 방식과 번역 패턴 방식을 혼합한 하이브리드자동 번역 장치 및 방법과 그 프로그램을 기록한 컴퓨터로읽을 수 있는 기록매체
    197.
    发明授权
    규칙 기반 방식과 번역 패턴 방식을 혼합한 하이브리드자동 번역 장치 및 방법과 그 프로그램을 기록한 컴퓨터로읽을 수 있는 기록매체 有权
    混合自动翻译装置和方法通过组合基于规则的方法和翻译模式方法,以及介质记录程序

    公开(公告)号:KR100542755B1

    公开(公告)日:2006-01-20

    申请号:KR1020030063517

    申请日:2003-09-15

    CPC classification number: G06F17/289 G06F17/2872

    Abstract: 본 발명은 규칙 기반 방식에서의 모호성 문제와 번역 패턴 방식에서의 패턴 생성 및 커버리지 문제를 해결하기 위해 규칙 기반 방식과 번역 패턴 방식을 혼합한 하이브리드 자동 번역 장치 및 방법과 그 기록 매체에 관한 것이다.
    본 발명에 따른 자동번역 장치는, 입력 원문에 대해 형태소를 분석하고 품사를 결정하는 형태소 분석 및 태깅 수단; 태깅 결과에 대해 구문 분석을 수행하여 파싱 트리를 출력하는 구문분석 수단; 파싱트리에서 하위범주의 구 청킹 결과만을 추출하여 구문패턴을 생성하는 구문패턴 생성 수단; 번역 패턴을 이용하여 상기 구문패턴에 대한 번역을 시도하는 구문패턴 번역 수단; 상기 구문패턴에 대한 번역패턴 매칭에 실패한 경우, 절구조 분석을 하는 절구조 분석 수단; 및 절구조 분석 결과에 따라 부분 구문패턴의 패턴번역을 수행하여 최종 번역결과를 출력하는 부분패턴 번역 수단;을 포함하는 것을 특징으로 한다
    파싱, 청킹, 커버리지, 구문패턴, 부분 패턴번역, 절구조 분석

    어휘 및 의미 공기패턴에 기반한 한국어 구조분석 시스템및 그 방법
    198.
    发明公开
    어휘 및 의미 공기패턴에 기반한 한국어 구조분석 시스템및 그 방법 有权
    基于语言和语义关系的韩国分离系统及其方法

    公开(公告)号:KR1020050065193A

    公开(公告)日:2005-06-29

    申请号:KR1020030096963

    申请日:2003-12-24

    Inventor: 김창현 박상규

    Abstract: 본 발명은 대량의 말뭉치로부터 어휘공기패턴 및 의미공기패턴을 자동으로 추출하여 구문분석에 적용함으로써 구문분석 결과의 품질을 향상시키는 어휘 및 의미 공기패턴에 기반한 한국어 구조분석 시스템 및 그 방법에 관한 것이다.
    본 발명의 구조분석 시스템은, 대량의 말뭉치로부터 어휘 및 의미 공기패턴을 추출하는 공기패턴 추출 시스템; 입력문에 대한 형태소 분석을 수행하는 형태소 분석기; 및 상기 형태소 분석 결과를 입력으로 하고 상기 어휘 및 의미 공기패턴을 이용하여 입력문의 구조를 분석하는 구조 분석기;로 구성된다.

    절단위 파싱을 통한 문장구조 분석 방법
    199.
    发明公开
    절단위 파싱을 통한 문장구조 분석 방법 无效
    方法通过分条单位分配声明分析结构

    公开(公告)号:KR1020040056642A

    公开(公告)日:2004-07-01

    申请号:KR1020020083163

    申请日:2002-12-24

    Abstract: PURPOSE: A sentence structure analyzing method is provided to parse each sentence by the unit of a clause, and to analyze a total sentence for translating the sentence in a machine translation system so that it enhances a translation quality. CONSTITUTION: The method comprises several steps. An original sentence is input, a syntax pattern generator transmits the original sentence to a morpheme analyzer and a tagger, and a syntax pattern is generated via a morpheme analysis, a tagging and a partial sentence parsing(S101). A clause structure parsing is performed for the generated syntax pattern from a sentence end to a sentence top(S102). A short sentence recognition is performed via a start point sensing, an end point sensing, and a short sentence reduction(S103). A rule matching process for each clause is performed in order to check whether there exists a rule matched with a current syntax pattern(S104). A combination candidate set between clauses is generated(S105). A clause structure tree for all the possible combination sets is generated, a weight value for each tree is calculated, and each candidate set is arranged on a basis of the calculated weight value(S106).

    Abstract translation: 目的:提供句子结构分析方法,以句子为单位来分析每个句子,并分析整个句子以翻译机器翻译系统中的句子,从而提高翻译质量。 构成:该方法包括几个步骤。 输入原始句子,语法模式生成器将原始语句发送到语素分析器和标签器,并通过语素分析,标签和部分句子解析生成语法模式(S101)。 对于从语句结尾到句子顶部的生成的语法模式执行子句结构解析(S102)。 通过起点感测,终点感测和短句减少来执行短句识别(S103)。 执行每个子句的规则匹配处理,以便检查是否存在与当前语法模式匹配的规则(S104)。 生成子句之间的组合候选者(S105)。 生成用于所有可能的组合集合的子句结构树,计算每个树的权重值,并且基于所计算的权重值来排列每个候选集(S106)。

Patent Agency Ranking