대표 형태소 어휘 문맥에 기반한 통계적 태깅 오류 정정장치 및 그 방법
    41.
    发明公开
    대표 형태소 어휘 문맥에 기반한 통계적 태깅 오류 정정장치 및 그 방법 失效
    一种用于根据代表性的立场形态和方法统计校正标记错误的设备

    公开(公告)号:KR1020050039379A

    公开(公告)日:2005-04-29

    申请号:KR1020030074832

    申请日:2003-10-24

    Abstract: 본 발명은 기존의 품사문맥 또는 어절어휘 규칙에 의한 태깅과는 달리 분석대상 어절 주변의 대표 형태소 어휘문맥 정보에 기반하여 통계적 방법으로 대상어절의 태깅 오류를 정정하는 대표 형태소 어휘문맥에 기반한 통계적 태깅 오류 정정 장치 및 방법에 관한 것이다.
    본 발명은 원시문장에 대해 품사문맥을 기반으로 형태소 분석 및 태깅을 하는 단계와, 각 형태소 어휘에 대해 대표어휘를 결정하고 분석대상 어절에 대한 대표 형태소 어휘문맥들을 생성하는 단계와, 통계정보를 참조하여 분석대상 어절의 각 형태소 후보에 대해 어절분석 확률과 대표 형태소 어휘문맥들의 확률을 산출하고, 이들을 결합하여 그 결과값이 가장 큰 후보를 최적 형태소후보로 선정하는 단계와, 최적 형태소후보로서 품사문맥 기반의 태깅 오류를 정정하는 단계로 이루어진다.

    동사구 패턴 기반 한중 자동 번역 시스템의 '하다' 동사의번역장치 및 방법
    42.
    发明授权
    동사구 패턴 기반 한중 자동 번역 시스템의 '하다' 동사의번역장치 및 방법 失效
    基于“汉字”与“X-lul hata”在韩汉机器翻译中的关系翻译“哈塔”动词的装置与方法

    公开(公告)号:KR100481453B1

    公开(公告)日:2005-04-07

    申请号:KR1020020070418

    申请日:2002-11-13

    Abstract: 본 발명은 동사구 패턴에 기반한 한중 자동 번역 시스템에서 '하다' 동사의 번역 장치 및 방법에 관한 것으로, 본 발명의 목적은 'X를 하다' 구문의 처리를 위한 별도의 '하다' 동사의 동사구 패턴을 구축하지 않게 하여 시스템에서 요구되는 동사구 패턴의 수를 줄이면서도 고품질의 번역이 가능하게 하는 것이다.
    본 발명에 따른 한국어 구조 분석기는 입력 결과에서 'X를 하다' 구문이 존재하는 지를 인식하고, 이를 'X하다' 구문으로 바꾸는 제 1단계; 데이터베이스에서 'X하다' 동사구 패턴을 가져와서 제1단계의 입력으로 들어온 'X를 하다' 구문의 제약조건을 만족하는 최적의 'X하다' 동사구 패턴을 선택하는 제 2단계; 'X하다' 동사구 패턴을 이용하여 한국어 입력문의 구문구조를 분석하는 제 3단계; 제 3단계에서 구문 분석된 'X하다' 구문의 결과를 'X를 하다' 구문 구조로 치환하는 제 4단계를 수행한다. 또한, 본 발명에서의 대역문 변환기는 이를 해결하기 위해 'X'가 관형절의 수식을 받는 'X를 하다' 구문이 입력되었는지를 인식하는 제 5단계; 수식을 받는 경우 'X를 하다' 구문이 어떤 유형에 속하는지를 판단하는 제 6단계; 'X를 하다'의 유형에 따라 관형어/절의 처리를 수행하는 제 7단계를 수행한다.

    규칙 기반 방식과 번역 패턴 방식을 혼합한 하이브리드자동 번역 장치 및 방법과 그 프로그램을 기록한 컴퓨터로읽을 수 있는 기록매체
    43.
    发明公开
    규칙 기반 방식과 번역 패턴 방식을 혼합한 하이브리드자동 번역 장치 및 방법과 그 프로그램을 기록한 컴퓨터로읽을 수 있는 기록매체 有权
    混合自动翻译装置和方法通过组合基于规则的方法和翻译图案方法,以及中程序记录程序

    公开(公告)号:KR1020050027298A

    公开(公告)日:2005-03-21

    申请号:KR1020030063517

    申请日:2003-09-15

    CPC classification number: G06F17/289 G06F17/2872

    Abstract: A hybrid automatic translation device for generating a high quality translation result of high coverage combining a rule-based method and a translation pattern method, a method thereof, and a computer-readable recording medium recording a program are provided to minimize ambiguity of parsing and a side effect of sentence division, and increase correctness of a phrasal pattern for translation pattern matching by extracting only the phrase unit result from a parsing result. A morpheme parser(101) parses morphemes from an input sentence. A tagger(102) determines each part of speech for a morpheme parsing result. A parser(103) parses a tagging result and outputs a parsing tree. A phrasal pattern generator(104) generates the phrasal pattern by extracting a chunking result of the phrases included in a sub category of verbs in the parsing tree. A phrasal pattern translator(105) performs translation for the phrasal pattern by using a translation pattern. A clause structure parser(106) checks a structure of a clause unit for the sentence in case that the translation pattern matching for the phrasal pattern is failed. A partial pattern translator(105-1) recognizes a partial phrasal pattern for each sub-clause by referring to a clause structure parsing result and performs the translation by using a partial translation pattern.

    Abstract translation: 提供一种混合自动翻译装置,用于生成组合基于规则的方法和翻译图案方法的高覆盖率的高质量翻译结果,其方法和记录程序的计算机可读记录介质,以最小化解析的模糊性和 句子分割的副作用,并通过从解析结果中提取单词结果,增加翻译模式匹配的短语模式的正确性。 语素解析器(101)从输入句解析语素。 标签器(102)为语素解析结果确定每个语音部分。 解析器(103)解析标记结果并输出解析树。 短语模式生成器(104)通过提取包含在解析树中的动词子类别中的短语的分块结果来生成短语模式。 短语模式翻译器(105)通过使用翻译模式来执行短语模式的翻译。 子句结构解析器(106)在短语模式匹配的翻译模式失败的情况下检查句子的子句单元的结构。 部分模式转换器(105-1)通过参考子句结构解析结果识别每个子句的部分短语模式,并通过使用部分转换模式执行翻译。

    복합 형태소 분석 장치 및 방법
    44.
    发明公开
    복합 형태소 분석 장치 및 방법 失效
    用于分析形成多个可能改善分析正确性的复合物的方法的装置和方法

    公开(公告)号:KR1020040101678A

    公开(公告)日:2004-12-03

    申请号:KR1020030033372

    申请日:2003-05-26

    Abstract: PURPOSE: A device and a method for analyzing a complex morpheme formed with multiple words are provided to enhance analysis correctness by applying a syllable or consonant/vowel base morpheme analysis and the complex morpheme analysis as a 2-step, excluding use of complex morpheme connection information, and additionally constructing spacing information. CONSTITUTION: A previously analyzed dictionary database stores a word unit morpheme analysis result by previously performing the word unit morpheme analysis of a Korean sentence. A preprocessor(202) determines application of a word-inside analysis by receiving/normalizing the sentence and using the previously analyzed dictionary database. A word-inside morpheme analyzer(204) performs the morpheme analysis in the word by using a word combination rule and an analysis algorithm. A word-outside morpheme analyzer(206) performs a word-outside morpheme analysis by using the spacing information for the input sentence. A part tagging part(208) performs morpheme tagging by using context tagging data and vocabulary tagging data.

    Abstract translation: 目的:提供一种用于分析由多个单词形成的复杂语素的设备和方法,以通过应用音节或辅音/元音基础语素分析和复杂语素分析作为2步骤来增强分析正确性,不包括使用复杂语素连接 信息,另外构成间隔信息。 构成:先前分析的字典数据库通过预先执行韩语句子的单词语素分析来存储单词语素分析结果。 预处理器(202)通过接收/归一化句子并使用先前分析的字典数据库来确定字内分析的应用。 词汇内部词素分析器(204)通过使用单词组合规则和分析算法来执行单词中的语素分析。 词外语素分析器(206)通过使用输入句子的间隔信息​​来执行词外语素素分析。 零件标签部分(208)通过使用上下文标记数据和词汇标签数据来执行语素标签。

    사/피동형 문장의 구조 분석 장치 및 그 방법
    45.
    发明授权
    사/피동형 문장의 구조 분석 장치 및 그 방법 失效
    사장/피동형문장의구조분석장치및그방법

    公开(公告)号:KR100453686B1

    公开(公告)日:2004-10-20

    申请号:KR1020020010460

    申请日:2002-02-27

    Abstract: PURPOSE: A passive and causative sentence structure analysis system and method is provided to enhance the case information determination performance by using the case frames, and to reduce the case frame number. CONSTITUTION: The system comprises a morpheme analyzer(10), a sentence normalizer(20), an active type case frame(30), a case frame converter(40), a case frame applicator(50), and a sentence structure analysis tree generator(60). The morpheme analyzer(10) analyzes the morphemes of an input passive or causative type sentence written in Hangul. The sentence normalizer(20) converts the morpheme analysis result into an active type sentence. The active type case frame(30) determines the case information based on the sentence normalization result of the sentence normalizer(20). The case frame converter(40) automatically converts auxiliary words and verb conjugations of the active type sentence into those of corresponding passive or causative type sentence for generating a passive or causative type conversion case frame. The case frame applicator(50) compares the morpheme analysis result with the conversion case frame, compares the sentence normalization result with the active type case frame, gives a weighting factor to a case frame according to a comparison result, and determines the case frame with the highest weighting factor as a final case frame. The sentence structure analysis tree generator(60) determines the case information based on the final case frame, analyzes the input passive or causative type sentence, and generates a sentence structure analysis result.

    Abstract translation: 目的:提供被动和致使句子结构分析系统和方法,以通过使用个案框架来提高个案信息确定性能,并减少个案框架数量。 该系统包括语素分析器(10),句子归一化器(20),主动式案例框架(30),案例框架转换器(40),案例框架应用器(50)和句子结构分析树 发生器(60)。 语素分析器(10)分析在韩文中写入的输入被动或致病类型句子的语素。 句子归一化器(20)将词素分析结果转换为活动类型句子。 活动型情况框(30)基于句子标准化程序(20)的句子标准化结果来确定情况信息。 案例框架转换器(40)自动将活动型句子的辅助词和动词变形转换成对应的被动或致因型句子的辅助词和动词变形,以产生被动或致因型转换情况框。 案例框架施加器(50)将词素分析结果与转换案例框架进行比较,将句子标准化结果与活动型框架进行比较,根据比较结果给出框架的加权因子,并且用 作为最终情况框架的最高权重因子。 句子结构分析树生成器(60)基于最终情况框确定案例信息,分析输入的被动或致因型句子,并生成句子结构分析结果。

    동적 번역자원을 이용한 분야 적응형 휴대용 방송자막기계번역 장치 및 방법
    46.
    发明授权
    동적 번역자원을 이용한 분야 적응형 휴대용 방송자막기계번역 장치 및 방법 有权
    使用动态翻译资源翻译封闭字幕的域自适应便携式机器翻译装置及其方法

    公开(公告)号:KR100837358B1

    公开(公告)日:2008-06-12

    申请号:KR1020060080921

    申请日:2006-08-25

    CPC classification number: G06F17/2827

    Abstract: 본 발명은 동적 번역자원을 이용한 분야 적응형 휴대용 방송자막 기계번역 장치 및 방법에 관한 것으로, 자막 문장의 문체 및 분야를 자동으로 인식하고 이에 적합한 특화된 번역 모듈 및 번역 지식을 동적으로 구성하여 해당 문장에 적합한 최적의 번역자원으로 자동번역을 수행함으로써, 다양한 전문분야에 대해서 번역 성능 향상을 도모할 수 있는 것을 특징으로 한다.
    본 발명에 따르면, 입출력 단자를 통해 다른 미디어장치와 자유롭게 연동이 가능한 분야 적응형 휴대용 방송자막 기계번역 장치를 구현할 수 있을 뿐만 아니라, 다양한 분야의 문장에 대하여 번역 성능의 향상을 도모할 수 있는 효과가 있다.
    기계번역 장치, 방송자막, 번역패턴

    병렬 말뭉치를 이용한 신조어의 대역어 자동 선정 방법 및장치
    47.
    发明公开
    병렬 말뭉치를 이용한 신조어의 대역어 자동 선정 방법 및장치 失效
    自动选择使用双胞胎的新词相关翻译的方法和装置

    公开(公告)号:KR1020080029567A

    公开(公告)日:2008-04-03

    申请号:KR1020060096341

    申请日:2006-09-29

    Abstract: A method and an apparatus for automatically selecting a translated word for a new coined word by using a bilingual corpus are provided to construct efficiently a bilingual translation dictionary. A method and an apparatus for automatically selecting a translated word for a new coined word comprises the following several steps. A morpheme and a structure analysis are performed with respect to sentences made of an original language, a lexical category analysis for words included in the sentences is analyzed and a grammar relation among words is determined(110). A unregistered word, which does not exist in a bilingual translation dictionary, is extracted from words in sentences made of the original language(120). Neighboring words related to the extracted unregistered word are selected from the sentences made of the original language(130). Translated words corresponding to the neighboring words are eliminated from translated sentences made of a target language, and remaining words are selected as translated words for the unregistered words(140). The unregistered words and the selected translated words are registered in the bilingual translation dictionary as new entries(150).

    Abstract translation: 提供了一种通过使用双语语料库自动选择新的创造词的翻译单词的方法和装置,以有效地构建双语翻译词典。 用于自动选择新的创造词的翻译单词的方法和装置包括以下几个步骤。 对原始语言句子进行词素和结构分析,对包含在句子中的单词进行词法分类分析,确定单词之间的语法关系(110)。 在双语翻译字典中不存在的未注册词是从原文语言(120)中的单词中提取出来的。 从原始语言(130)中选择与提取的未注册词相关的相关词。 对应于相邻单词的翻译字从消除由目标语言构成的翻译句子中消除,并且剩余单词被选择为未注册单词(140)的翻译单词。 未登记的单词和所选择的翻译单词在双语翻译字典中被注册为新的条目(150)。

    병렬 구조 인식을 통한 구문 분석 장치 및 방법
    48.
    发明公开
    병렬 구조 인식을 통한 구문 분석 장치 및 방법 无效
    使用并行结构检测的装置和方法进行统计分析

    公开(公告)号:KR1020080024638A

    公开(公告)日:2008-03-19

    申请号:KR1020060089008

    申请日:2006-09-14

    CPC classification number: G06F17/271

    Abstract: A device and a method for analyzing syntax by recognizing a parallel structure are provided to divide excessively long sentences found in a patent document with high correctness, and raise syntax analysis efficiency/correctness by dividing the sentence into more syntaxes. A chunking part(100) tags and partially parses an inputted raw English document. A node recognizer(200) recognizes a parallel node starting point of the raw document. A similarity calculator(300) calculates similarity weight among parallel nodes based on the similarity of vocabulary/part-of-speed of a starting word, a head, and the word next to the head. A parallel structure recognizer(400) searches all available parallel structures based on the calculated similarity weight, calculates the weight of the searched parallel structures, and recognizes the parallel structure of the raw document based on the calculated weight of the parallel structure. A parallel structure parser(500) parses the recognized parallel structure. A whole sentence parser(600) parses the whole raw sentence again which is inputted from a parsing result.

    Abstract translation: 提供一种用于通过识别并行结构来分析语法的装置和方法,以高精度地划分专利文件中发现的较长的句子,并通过将句子分为更多语法来提高语法分析的效率/正确性。 分块部分(100)标记并部分地分析输入的原始英文文档。 节点识别器(200)识别原始文档的并行节点起始点。 相似度计算器(300)基于起始词,头部和头部旁边的单词的词汇/部分速度的相似度,计算并行节点之间的相似度权重。 并行结构识别器(400)基于所计算的相似度权重搜索所有可用的并行结构,计算所搜索的并行结构的权重,并且基于所计算的并行结构的权重来识别原始文档的并行结构。 并行结构解析器(500)解析识别的并行结构。 整个句子解析器(600)解析从解析结果输入的整个原始句子。

    의미공기정보 지식베이스 구축 방법 및 장치
    49.
    发明授权
    의미공기정보 지식베이스 구축 방법 및 장치 失效
    构建语义同现模式数据库的方法与装置

    公开(公告)号:KR100784441B1

    公开(公告)日:2007-12-11

    申请号:KR1020060060374

    申请日:2006-06-30

    Abstract: 본 발명은 (a)제1 어휘공기정보 지식베이스와 명사 의미 코드 사전을 이용하여 중의성이 없는 제1 의미공기정보 지식베이스와 중의성이 존재하는 제2 의미공기정보 지식베이스를 구축하고, (b)상기 제1 및 제2 의미공기정보 지식베이스에 포함된 각 어휘공기정보의 빈도수를 이용하여 제2 어휘공기정보 지식베이스를 구축하고, (c)상기 제1 및 제2 의미공기정보지식베이스에서 상기 제2 어휘공기정보 지식베이스로 이동한 어휘공기정보를 각각 제거하여 제3 및 제4 의미공기정보 지식베이스를 구축하고, (d)상기 구축된 제3 및 제4 의미공기정보 지식베이스를 이용하여 상기 제4 의미공기정보 지식베이스에 존재하는 중의성을 감소시켜 중의성이 감소된 제5 의미공기정보 지식베이스 및 중의성이 없는 제6 의미공기정보 지식베이스를 구축하고, (e)상기 제5 및 제6 의미공기정보 지식베이스에 포함된 각 어휘공기정보의 빈도수를 조정하여 최종 의미공기정보 지식베이스를 구축하는 것으로서, 구조적 중의성 해소와 동시에 명사의 의미를 결정할 수 있으므로, 구조적 중의성 해소의 정확성 향상에 따라, 의미적 중의성 해소 정확도를 향상시킬 수 있다.
    코퍼스, 의미공기정보, 어휘공기정보, 중의성

    의미공기정보 지식베이스 구축 방법 및 장치
    50.
    发明公开
    의미공기정보 지식베이스 구축 방법 및 장치 失效
    用于构建语义共同作用模式的数据库的方法和装置

    公开(公告)号:KR1020070059881A

    公开(公告)日:2007-06-12

    申请号:KR1020060060374

    申请日:2006-06-30

    CPC classification number: G06F17/277

    Abstract: A method and a device for constructing a semantic co-occurrence information knowledge-base are provided to minimize information distortion of the semantic co-occurrence information by using lexical co-occurrence information and a noun meaning code dictionary. A morpheme analyzer(110) outputs a morpheme analysis result from a corpus(100). A lexical co-occurrence information generator(120) constructs the lexical co-occurrence information knowledge-base(125) from the morpheme analysis result. A lexical co-occurrence information generator(140) constructs the semantic co-occurrence information knowledge-base(145) by using the noun meaning code dictionary(130) to relax data shortage of the lexical co-occurrence information knowledge-based constructed by the lexical co-occurrence information generator.

    Abstract translation: 提供了一种用于构建语义共生信息知识库的方法和设备,以通过使用词汇同现信息和名词意义代码词典来最小化语义共生信息的信息失真。 语素分析器(110)从语料库(100)输出语素分析结果。 词汇共现信息生成器(120)从语素分析结果构建词汇同现信息知识库(125)。 词汇同现信息生成器(140)通过使用名词含义码字典(130)构建语义共生信息知识库(145),以放松由基于知识的知识库构建的词汇共生信息知识的数据短缺 词汇同现信息发生器。

Patent Agency Ranking