특허 번역 사전 구축 장치 및 방법
    101.
    发明授权
    특허 번역 사전 구축 장치 및 방법 有权
    装置和方法建立专利翻译字典

    公开(公告)号:KR100818628B1

    公开(公告)日:2008-04-02

    申请号:KR1020060089003

    申请日:2006-09-14

    Abstract: 대용량의 특허 번역 사전을 효율적이며 경제적으로 구축하는 장치 및 방법을 개시한다. 이를 위하여, 상기 장치는 기구축된 전문 용어를 입력받아 특허 번역 사전용 DB에 기록 가능한 형태로 상기 입력된 전문 용어의 포맷을 변경하여 확장 사전용 DB에 기록하는 용어 재구성부와, 출발 언어 특허 문서를 입력받아 상기 확장 사전용 DB에 기록되지 않은 미등록 전문 용어를 상기 특허 문서로부터 추출하고, 상기 추출된 미등록 전문 용어 중에서 단일어 엔트리를 분류하며, 대역어가 부착되지 않은 상기 단일어 엔트리에 대해 상기 대역어를 부착한 후, 상기 확장 사전용 DB에 상기 엔트리를 추가하는 용어 처리부와, 목표 언어 특허 문서를 입력받아 상기 확장 사전용 DB에서 복수의 대역어들에 대해 특허 분야에 적합한 대역어를 선택하고, 복합어에 대해서는 특화된 단일어 대역어로 번역한 후, 상기 특허 번역 사전용 DB에 기록하는 대역어 특화부를 포함함으로써, 특허 분야별로 대역어가 구분된 대용량의 특허 번역 사전을 구축하는 시간과 비용을 절약할 수 있다.
    대용량, 단일어, 번역, 사전

    특허 번역 사전 구축 장치 및 방법
    102.
    发明公开
    특허 번역 사전 구축 장치 및 방법 有权
    装置和方法建立专利翻译字典

    公开(公告)号:KR1020080024635A

    公开(公告)日:2008-03-19

    申请号:KR1020060089003

    申请日:2006-09-14

    CPC classification number: G06Q50/10 G06F17/21 G06F17/30286 G06Q50/18

    Abstract: A device and a method for constructing a patent translation dictionary are provided to construct a large patent translation dictionary capable of minimizing interference of a user efficiently and economically. A term reformer(200) receives/converts previously constructed technical terms into a format available in a patent translation dictionary database(500) and records the converted terms to an extended dictionary database(900). A term processor(300) extracts the technical terms unregistered to the extended dictionary database from a patent document written in a source language, classifies a single word entry from the unregistered technical terms, attaches a translation to the single-word entry attaching no translation, and adds the single-word entry to the extended dictionary database. A translation specializer(400) selects the translation suitable for a patent field from the extended dictionary database by receiving a target language patent document, translates a compound word into the specialized single-word translation, and writes the single-word translation to the extended dictionary database.

    Abstract translation: 提供了一种用于构建专利翻译词典的装置和方法,以构建能够有效和经济地最小化用户干扰的大型专利翻译词典。 术语重组器(200)将先前构建的技术术语接收/转换为专利翻译词典数据库(500)中可用的格式,并将转换的术语记录到扩展字典数据库(900)。 术语处理器(300)从从源语言编写的专利文献中提取未注册到扩展字典数据库的技术术语,从未注册的技术术语对单个词条进行分类,将翻译附加到不加翻译的单词条目, 并将单字条目添加到扩展字典数据库。 翻译专家(400)通过接收目标语言专利文献从扩展字典数据库中选择适合于专利领域的翻译,将复合词翻译成专门的单字翻译,并将单字翻译写入扩展字典 数据库。

    태깅된 도메인 코퍼스 없이 새로운 도메인에 적용 가능한통계적 HMM 품사 태깅 장치 및 방법
    103.
    发明授权
    태깅된 도메인 코퍼스 없이 새로운 도메인에 적용 가능한통계적 HMM 품사 태깅 장치 및 방법 有权
    用于统计HMM词性标签的无标签域语料库的方法和装置

    公开(公告)号:KR100784730B1

    公开(公告)日:2007-12-12

    申请号:KR1020060056201

    申请日:2006-06-22

    Abstract: 본 발명은 통계적 HMM(Hidden Markov Model) 품사 태깅 장치 및 방법에 관한 것으로, 적용 도메인에 따라 어휘확률이 달라지는 어휘를 선출하여 그 어휘의 어휘확률을 적용 도메인에 맞추어 갱신함으로써, 많은 비용과 시간이 드는 적용 도메인의 태깅된 코퍼스 없이, 다양한 도메인에서 높은 성능으로 적용할 수 있는 것을 특징으로 한다.
    본 발명에 따르면, 새로운 특정 도메인에서 정확도가 떨어지는 기존의 통계적 품사 태깅 방법에 비하여, 품사 태깅의 정확성을 크게 향상시킬 수 있으며, 손쉽게 획득할 수 있는 다양한 도메인의 원시 코퍼스(raw corpus)들을 기반으로 각 도메인 의존 어휘확률만을 새로이 재학습하여 갱신함으로써, 태깅된 도메인 코퍼스 없이 특정 도메인에서의 태깅 정확성을 높일 뿐만 아니라 다양한 도메인에서 높은 정확도의 통계적 품사 태깅을 수행할 수 있는 효과가 있다.
    품사태깅, 확률, HMM, 도메인, 코퍼스

    기존 대역 전자사전의 어휘 대역어 공기 정보 및 확률정보를 이용한 복합명사 대역어 생성 장치 및 방법
    104.
    发明授权
    기존 대역 전자사전의 어휘 대역어 공기 정보 및 확률정보를 이용한 복합명사 대역어 생성 장치 및 방법 失效
    使用现有电子词典中词汇词的同现信息和概率信息自动翻译复合名词的方法和装置

    公开(公告)号:KR100779164B1

    公开(公告)日:2007-11-26

    申请号:KR1020060030127

    申请日:2006-04-03

    Abstract: 본 발명은 기존 대역 전자사전의 어휘 대역어 공기 정보 및 확률 정보를 이용한 복합명사 대역어 생성 장치 및 방법에 관한 것으로, 이미 구축되어 있는 기존 대역 전자사전에서 어휘 대역어 공기 정보 및 확률 정보를 자동으로 추출하여 이를 기반으로 복합명사에 대한 대역어를 선택하도록 하는 것을 특징으로 한다.
    본 발명에 따르면, 종래와 같이 의미 태그드 코퍼스를 수동으로 구축할 필요 없이 대역어 선택에 있어서 문제가 되는 의미 중의성 문제와 동일 의미의 이종 대역어 표현 문제를 해결할 수 있으므로, 이에 따라 종래의 대역어 생성 방법에 비해 문맥에 맞는 자연스러운 대역어를 선택할 수 있게 된다.
    복합명사, 어휘, 대역어, 공기, 확률, 문맥, 모호성, 중의성

    제한적인 도메인의 문서를 대상으로 특화된 자동 번역 장치및 방법
    105.
    发明公开
    제한적인 도메인의 문서를 대상으로 특화된 자동 번역 장치및 방법 有权
    自动翻译用于限制性域名文件的装置及其方法

    公开(公告)号:KR1020070058950A

    公开(公告)日:2007-06-11

    申请号:KR1020060056203

    申请日:2006-06-22

    Abstract: A device and a method for automatic translation customized to restrictive domain documents are provided to effectively perform the automatic translation by extracting translation knowledge customized to a patent domain and utilizing the extracted knowledge, and perform a structure analysis by extracting a parable analysis range from a long sentence based on the extracted language. A knowledge extractor(100) extracts the translation knowledge needed for translating the document of the restricted domain. A translator(200) generates a translation for the inputted sentence based on a dictionary(300) and a conversion pattern(400) applying the extracted translation knowledge. The knowledge extractor includes a specialized term constructor(110) extracting and constructing specialized terms by constructing a corpus corresponding to the document of the restricted domain through a morpheme analysis/tagging, a translation constructing/refining part(120), and a pattern/phrase pattern constructing part(130). The translator includes a preprocessor(210), a morpheme analyzing/tagging part(220), a structure analyzer(230), a structure/vocabulary converter(240), and a generator(250).

    Abstract translation: 提供一种针对限制性域名文档进行自动翻译的设备和方法,通过提取定制到专利领域的翻译知识和利用提取的知识来有效地执行自动翻译,并通过从长时间提取比较分析范围来进行结构分析 基于提取语言的句子。 知识提取器(100)提取翻译受限域文档所需的翻译知识。 翻译器(200)基于字典(300)和应用提取的翻译知识的转换模式(400)来生成输入的句子的翻译。 知识提取器包括专门的术语构造器(110),通过语素分析/标记,翻译构建/提炼部分(120)和模式/短语构建与受限域的文档相对应的语料库来提取和构造专门术语 图案构造部(130)。 翻译器包括预处理器(210),语素分析/标记部分(220),结构分析器(230),结构/词汇转换器(240)和发生器(250)。

    영한 자동번역을 위하여 동사구 패턴 및 의미 벡터를 사용하는 동사/명사 대역어 선택 장치 및 그 방법
    106.
    发明授权
    영한 자동번역을 위하여 동사구 패턴 및 의미 벡터를 사용하는 동사/명사 대역어 선택 장치 및 그 방법 失效
    用于使用动词模式选择名词/动词的目标词的装置,用于英 - 韩机器翻译的检测向量及其方法

    公开(公告)号:KR100617319B1

    公开(公告)日:2006-08-30

    申请号:KR1020050018746

    申请日:2005-03-07

    Abstract: 본 발명에 의한 영한 자동번역을 위하여 동사구 패턴 및 의미 벡터를 사용하는 동사/명사 대역어 선택 장치 및 그 방법은 영한 병렬 코퍼스와 영어 모노링궐(monolingual) 코퍼스 및 워드넷에 기반한 의미코드를 기초로 동사구 패턴 데이터베이스를 구축하는 단계; 원문과 대역문의 쌍으로 이루어지는 병렬 코퍼스내의 각 문장 쌍에 대하여 어휘 정렬을 수행한 후 의미벡터 및 한국어 국소 문맥 정보를 구축하는 단계; 입력되는 문장을 단문 단위로 분할하여 상기 동사구 패턴 데이터베이스를 참조하여 상기 단문에 적용할 동사구 패턴을 검색하는 단계; 상기 검색에 성공하면 검색된 동사구 패턴을 기초로 동사의 대역어와 각 논항의 명사 의미코드를 결정하는 단계; 상기 검색에 실패하고 상기 동사구 패턴이 적용되지 않는 경우에는 소정의 디폴트 동사구 패턴을 적용하여 기본적인 동사 대역어를 선정하는 단계; 및 상기 검색에 실패하고 상기 동사의 논항이 명사구이면 영어 공기 어휘를 이용하여 의미코드를 결정하는 단계;를 포함하는 것을 특징으로 하며, 동사구 패턴에 의해 동사와 헤드 명사에 대한 대역어를 선택하고, 또한 공기 정보에 의해 헤드 명사가 아닌 기타 명사에 대한 대역어 선택도 가능하다.
    기계번역, 자동번역, 대역어 선택, 의미 벡터, 동사구 패턴

    영한 자동번역을 위하여 동사구 패턴 및 의미 벡터를 사용하는 동사/명사 대역어 선택 장치 및 그 방법
    107.
    发明公开
    영한 자동번역을 위하여 동사구 패턴 및 의미 벡터를 사용하는 동사/명사 대역어 선택 장치 및 그 방법 失效
    用于使用VERB模式选择目标字的设备用于英文 - 韩国机器翻译的VERB模式和感应矢量及其方法

    公开(公告)号:KR1020060067073A

    公开(公告)日:2006-06-19

    申请号:KR1020050018746

    申请日:2005-03-07

    CPC classification number: G06F17/289 G06F17/2755 G06F17/2795 G06F17/30427

    Abstract: 본 발명에 의한 영한 자동번역을 위하여 동사구 패턴 및 의미 벡터를 사용하는 동사/명사 대역어 선택 장치 및 그 방법은 영한 병렬 코퍼스와 영어 모노링궐(monolingual) 코퍼스 및 워드넷에 기반한 의미코드를 기초로 동사구 패턴 데이터베이스를 구축하는 단계; 원문과 대역문의 쌍으로 이루어지는 병렬 코퍼스내의 각 문장 쌍에 대하여 어휘 정렬을 수행한 후 의미벡터 및 한국어 국소 문맥 정보를 구축하는 단계; 입력되는 문장을 단문 단위로 분할하여 상기 동사구 패턴 데이터베이스를 참조하여 상기 단문에 적용할 동사구 패턴을 검색하는 단계; 상기 검색에 성공하면 검색된 동사구 패턴을 기초로 동사의 대역어와 각 논항의 명사 의미코드를 결정하는 단계; 상기 검색에 실패하고 상기 동사구 패턴이 적용되지 않는 경우에는 소정의 디폴트 동사구 패턴을 적용하여 기본적인 동사 대역어를 선정하는 단계; 및 상기 검색에 실패하고 상기 동사의 논항이 명사구이면 영어 공기 어휘를 이용하여 의미코드를 결정하는 단계;를 포함하는 것을 특징으로 하며, 동사구 패턴에 의해 동사와 헤드 명사에 대한 대역어를 선택하고, 또한 공기 정보에 의해 헤드 명사가 아닌 기타 명사에 대한 대역어 선택도 가능하다.
    기계번역, 자동번역, 대역어 선택, 의미 벡터, 동사구 패턴

    명사 의미코드 부착 방법 및 그 장치
    108.
    发明公开
    명사 의미코드 부착 방법 및 그 장치 失效
    用于粘贴灭鼠符号的方法及其装置

    公开(公告)号:KR1020060064446A

    公开(公告)日:2006-06-13

    申请号:KR1020050020033

    申请日:2005-03-10

    CPC classification number: G06F17/2809 G06F17/2735 G06F17/30613

    Abstract: 본 발명에 의한 명사 의미 코드 부착 방법 및 그 장치에 의하면, 영한 자동 번역 방법에 있어서, 사전에 등재할 명사 표현에 대역어를 부착하는 단계; 상기 대역어가 부착된 명사 표현에서 핵심 명사를 추출하는 단계; 및 상기 명사 표현에 의미코드를 부착하는 단계;를 포함하는 것을 특징으로 하며, 자동번역 시스템에서 명사 의미코드 부착 방식을 수동 부착 방식에서 반자동 부착방식으로 전환시킴으로서, 명사에 의미코드를 부착하는 시간을 단축할 수 있으며, 명사에 의미코드가 일관성 있게 부착될 수 있고, 명사 의미코드가 부착됨으로 번역 정확도가 향상되며, 동사 대역어 선택시에 명사의 의미코드를 논항으로 사용함으로써 동사 대역어 선택의 커버리지를 향상시킬 수 있는 효과가 있다.
    영한 자동번역, 명사 의미코드 부착

    국소 구문관계 및 의미 공기사전에 기반한 형태소 의미자동 태깅장치
    109.
    发明公开
    국소 구문관계 및 의미 공기사전에 기반한 형태소 의미자동 태깅장치 失效
    基于本地语言关系和语义同义词自动标记语义的系统

    公开(公告)号:KR1020040056701A

    公开(公告)日:2004-07-01

    申请号:KR1020020083246

    申请日:2002-12-24

    Abstract: PURPOSE: An automatic morpheme semantics tagging system is provided to automatically tag semantics of morphemes by using syntax data and semantic co-occurrence data of a declinable phrase and a noun phrase so that it enhances a meaning determination correctness. CONSTITUTION: The system comprises a short sentence recognizer(102), an auxiliary word case recovery module(103), an argument noun meaning determination module(104), and a noun phrase meaning determination module(105). The short sentence recognizer(102) recognizes a short sentence by using a basic syntax generation rule, a dependency syntax rule, an electronic morpheme meaning dictionary, a semantics frame and a declinable phrase co-occurrence dictionary generated via a morpheme analysis of an original sentence. The auxiliary word case recovery module(103) performs a case recovery for an auxiliary word by using a semantics frame and a declinable phrase semantics co-occurrence dictionary. The argument noun meaning determination module(104) determines a meaning on an argument noun. The noun phrase meaning determination module(105) determines a meaning on a noun within a noun phrase and a compound noun.

    Abstract translation: 目的:提供自动语素语义标记系统,通过使用语法数据和不可分割短语和名词短语的语义共生数据自动标记语素的语义,从而增强意义确定的正确性。 构成:系统包括短句识别器(102),辅助字盒恢复模块(103),参数名词含义确定模块(104)和名词短语含义确定模块(105)。 短句识别器(102)通过使用基本语法生成规则,依赖语法规则,电子语素含义字典,语义框架和通过原始句子的语素分析生成的可拒绝短语同现字典识别短句 。 辅助单词恢复模块(103)通过使用语义框架和可下降的短语语义共同词典来执行辅助单词的情况恢复。 参数名词含义确定模块(104)确定参数名词上的含义。 名词短语意义确定模块(105)确定名词短语中的名词和复合名词的含义。

    번역 지원 시스템에서의 유사 문장 검색 방법
    110.
    发明公开
    번역 지원 시스템에서의 유사 문장 검색 방법 失效
    在翻译支持系统上搜索类似的方法

    公开(公告)号:KR1020030056655A

    公开(公告)日:2003-07-04

    申请号:KR1020010086929

    申请日:2001-12-28

    CPC classification number: G06F17/2836

    Abstract: PURPOSE: A method for searching a similar sentence on a translation support system is provided to improve accuracy of the system by offering a similarity measure between sentences for searching the most similar example from a translation memory, and outputting a searched source sentence and the corresponding translation sentence. CONSTITUTION: The translation memory(105) comprises the source sentence, a morpheme analysis result of the source sentence, and the translation sentence by performing the morpheme analysis of a parallel corpus(101) in not processed form through a morpheme analyzer(102). An index reverse-file(104) is formed by extracting an index word from each source sentence forming the translation memory(105). A filtering part(106) separately extracts the morpheme corresponding to a noun, a verb, and an adjective used as the index word from the inputted source sentence. A searching part(107) loads a searching result after searching the candidate sentences provided from the filtering part(106) through the translation memory(105). A similarity calculation part(108) calculates the similarity applying a weight of each part for the candidate sentences by using an edit distance method.

    Abstract translation: 目的:提供一种在翻译支持系统上搜索类似句子的方法,以通过提供用于从翻译记忆库搜索最相似的示例的句子之间的相似性度量来提高系统的准确性,并且输出搜索的源语句和相应的翻译 句子。 构成:翻译记忆库(105)通过语素分析器(102)通过以未处理的形式执行并行语料库(101)的语素分析,包括源句子,源语句的语素分析结果和翻译句子。 索引反向文件(104)通过从构成翻译存储器(105)的每个源语句中提取索引词来形成。 过滤部分(106)分别从输入的源语句中提取对应于名词,动词和用作索引词的形容词的语素。 搜索部分(107)在通过翻译记忆库(105)搜索从过滤部分(106)提供的候选句子之后加载搜索结果。 相似度计算部(108)通过使用编辑距离法来计算应用候选句子的各部分的权重的相似度。

Patent Agency Ranking