문서정보 학습기반 통계적 HMM 품사 태깅 장치 및 그 방법
    141.
    发明公开
    문서정보 학습기반 통계적 HMM 품사 태깅 장치 및 그 방법 有权
    用于基于文本学习的统计HMM的装置语音标签及其方法

    公开(公告)号:KR1020110018140A

    公开(公告)日:2011-02-23

    申请号:KR1020090075778

    申请日:2009-08-17

    CPC classification number: G06F17/2705 G06F17/18 G06F17/2755 G06F17/277

    Abstract: PURPOSE: A statistical HMM part tagging apparatus and a method thereof for increasing the tagging performance of a morpheme part are provided to increase the accuracy of tagging about a document of a domain by using learning information. CONSTITUTION: A real time learning based statistical part tagging unit(103) utilizes vocabulary stored in a vocabulary probability information DB and context stored in a context probability information DB. A real time learning based tagging error correction unit(105) corrects an error through a tagging error modification DB. A real time document information learning unit(101) establishes real time context probability information DB after extracting context probability information.

    Abstract translation: 目的:提供用于提高语素部分的标记性能的统计HMM部分标签装置及其方法,以通过使用学习信息来增加关于域的文档的标签的准确性。 构成:基于实时学习的统计部分标记单元(103)利用存储在词汇概率信息DB中的词汇和存储在上下文概率信息DB中的上下文。 基于实时学习的标记纠错单元(105)通过标记错误修改DB来校正错误。 实时文档信息学习单元(101)在提取上下文概率信息之后建立实时上下文概率信息DB。

    신조어 선정 장치 및 그 방법
    142.
    发明公开
    신조어 선정 장치 및 그 방법 失效
    神经选择装置及其方法

    公开(公告)号:KR1020100073182A

    公开(公告)日:2010-07-01

    申请号:KR1020080131776

    申请日:2008-12-22

    CPC classification number: G06F17/2705 G06F17/2755

    Abstract: PURPOSE: A neologism selection device and a method thereof are provided to determine priority of neologism candidate based on a theme and select neologism according to the priority. CONSTITUTION: A morpheme analyzer(102) performs morphological analysis about input web document. A keyword extractor(106) extracts a keyword corresponding to neologism candidate from analyzed sentence. A subject detecting and tracking unit(108) performs theme detection and theme tracking through the extracted keyword. According to a subject keyword weight of the keyword, a priority determination unit(110) selects neologism according to the priority after determination of priority.

    Abstract translation: 目的:提供新词选择装置及其方法,以根据主题确定新词候选者的优先级,并根据优先级选择新词。 构成:语素分析器(102)对输入的Web文档进行形态分析。 关键词提取器(106)从分析语句中提取与新词候选者相对应的关键字。 被摄体检测跟踪单元(108)通过提取的关键字进行主题检测和主题跟踪。 根据关键词的主题关键字权重,优先级确定单元(110)在确定优先级之后根据优先级选择新词。

    영한 자동번역 시스템의 번역문 생성 방법 및 장치
    143.
    发明公开
    영한 자동번역 시스템의 번역문 생성 방법 및 장치 有权
    在韩国翻译系统中产生翻译句子的方法与装置

    公开(公告)号:KR1020100073162A

    公开(公告)日:2010-07-01

    申请号:KR1020080131756

    申请日:2008-12-22

    CPC classification number: G06F17/2809 G06F17/274 G06F17/2755

    Abstract: PURPOSE: A method and a device for generating translation sentence in an automatic English-Korean translation system are provided to automatically generate prefinal-ending corresponding to information delivered from Korean to English verb by information which an auxiliary verb or a temporal adverbial phrase transfers to a verb. CONSTITUTION: An English morpheme analyzer(100) analyzes input English sentence in a morpheme unit. A structure analyzer(300) analyzes English structure. English transforming unit(400) changes construction analysis result into Korean structure. A Korean generator(500) generates the Korean structure in the Korean morpheme unit. A perfinal-ending processor(600) transfers Korean perfinal-ending information corresponding to information about the English auxiliary verb group to the Korean generator.

    Abstract translation: 目的:提供一种用于在自动英语 - 韩语翻译系统中生成翻译句子的方法和装置,用于根据辅助动词或时间语言短语转移到英文动词的信息自动生成对应于从韩语输入到英语动词的信息的前缀结尾 动词。 构成:英语词素分析器(100)分析语素单位中的输入英语句子。 结构分析器(300)分析英文结构。 英文变换单位(400)将建筑分析结果变更为韩国结构。 韩国发电机(500)在韩国语素单位中生成韩国结构。 一个付费终端处理器(600)将与英语辅助动词组相关的韩语完成信息传送给韩语发音器。

    번역 오류 후처리 보정 장치 및 방법
    144.
    发明公开
    번역 오류 후처리 보정 장치 및 방법 失效
    翻译错误后期编码的装置和方法

    公开(公告)号:KR1020100062834A

    公开(公告)日:2010-06-10

    申请号:KR1020090027750

    申请日:2009-03-31

    CPC classification number: G06F17/2854 G06F17/2705

    Abstract: PURPOSE: An apparatus and a method for translation-error post-editing are provided to recognize an error of a final translation version automatically and modify the recognized error. CONSTITUTION: A correction word candidate generator(304) generates an error correction word candidate for estimated translation errors based on the original sentence analysis information of a translation system, and a correction word selector(306) selects the final correction word for the generated error correction word candidate by using an error specialization language model according to an error type. The correction word selector reflects the final correction word to a translation result, and corrects the errors.

    Abstract translation: 目的:提供翻译错误后编辑的装置和方法,以自动识别最终翻译版本的错误,并修改识别的错误。 构成:校正字候选发生器(304)基于翻译系统的原始句子分析信息生成用于估计翻译错误的纠错词候选,并且校正字选择器(306)为所生成的纠错码选择最终校正字 通过根据错误类型使用错误专门化语言模型进行词候选。 校正字选择器将最终校正字反映到翻译结果,并校正错误。

    번역 지식 구축 방법 및 장치
    145.
    发明授权
    번역 지식 구축 방법 및 장치 失效
    构建翻译知识的方法与设备

    公开(公告)号:KR100912501B1

    公开(公告)日:2009-08-17

    申请号:KR1020070080065

    申请日:2007-08-09

    CPC classification number: G06F17/28

    Abstract: 본 발명은 번역기에서 사용할 번역 지식을 자동 구축하는 방법 및 장치에 관한 것이다. 본 발명은 소스언어 문장과 상기 소스언어 문장의 번역 문장에 대응하는 타겟언어 문장이 입력되면 상기 소스언어 문장 및 상기 타겟언어 문장의 각 형태소에 품사, 원형, 기본구내에서의 상대적 위치 정보 및 구문 정보를 부착하여 상기 소스언어 문장 및 타겟언어 문장을 변환한 후, 상기 변환한 소스언어 문장과 타겟언어 문장의 단어 정렬과 구문 정렬을 수행하고 상기 단어 정렬 결과와 상기 구문 정렬 결과에서 단어 구문 번역 지식, 이중언어 용언 하위범주 번역 지식 및 이중언어 문형 번역 지식을 추출한다.
    대역사전, 단어 정렬, 구문 정렬, 의존관계 분석기, 단어/구문 대역 사전 구축, 이중언어 용언 하위범주 패턴 추출, 이중언어 문형 추출, 이중언어 단어/구문 클러스터

    한국어 수량사 생성 방법 및 장치
    146.
    发明授权
    한국어 수량사 생성 방법 및 장치 有权
    创造韩国语言量词的方法与装置

    公开(公告)号:KR100886688B1

    公开(公告)日:2009-03-04

    申请号:KR1020070128563

    申请日:2007-12-11

    Abstract: A method and an apparatus for creating a quantifier of Korean language are provided to generate quantifiers proper to a Korean syntactic structure in a combination word in which a number and a noun is combined when translating sentences through morphological and syntactic analysis in a machine translation. A quantifier extracting unit extracts quantifier information according to the information as to parts of speech for all sentences which constitute a Koran corpus, and a quantifier filtering part(114) filters the quantifier information. A feature value assigning unit(116) assigns only high frequent quantifier information to Korean target words of dictionary database in feature value. A quantifier generating unit(120) generates quantifiers based on the feature value associated with the quantifiers assigned to each target word, and a Korean corpus collecting unit(100) collects the large amount of Korean corpus and databases the collected Korean corpus as source corpus. A Korean morpheme analyzing and tagging unit(104) performs a morpheme analysis and tagging operation for the all sentences which constitutes the corpus and performs a database operation in Korean tagged corpus.

    Abstract translation: 提供了一种用于创建韩语的量词的方法和装置,用于在通过机器翻译中的形态和语法分析翻译句子时,以组合词中的数字和名词组合来产生适合韩国语法结构的量词。 量化器提取单元根据构成古兰经语料的所有句子的语音部分的信息提取定量器信息,量化器滤波部分(114)对量化器信息进行滤波。 特征值分配单元(116)在特征值中仅将高频率量词信息分配给词典数据库的韩语目标词。 量化器生成单元(120)基于与分配给每个目标词的量词相关联的特征值生成量词,韩国语料库收集单元(100)收集大量的韩语语料库并将收集的韩语语料库数据库作为源语料库。 韩国语素分析和标签单元(104)对构成语料库的所有句子执行语素分析和标记操作,并在韩语标签语料库中执行数据库操作。

    동적 번역자원을 이용한 분야 적응형 휴대용 방송자막기계번역 장치 및 방법
    147.
    发明授权
    동적 번역자원을 이용한 분야 적응형 휴대용 방송자막기계번역 장치 및 방법 有权
    使用动态翻译资源翻译封闭字幕的域自适应便携式机器翻译装置及其方法

    公开(公告)号:KR100837358B1

    公开(公告)日:2008-06-12

    申请号:KR1020060080921

    申请日:2006-08-25

    CPC classification number: G06F17/2827

    Abstract: 본 발명은 동적 번역자원을 이용한 분야 적응형 휴대용 방송자막 기계번역 장치 및 방법에 관한 것으로, 자막 문장의 문체 및 분야를 자동으로 인식하고 이에 적합한 특화된 번역 모듈 및 번역 지식을 동적으로 구성하여 해당 문장에 적합한 최적의 번역자원으로 자동번역을 수행함으로써, 다양한 전문분야에 대해서 번역 성능 향상을 도모할 수 있는 것을 특징으로 한다.
    본 발명에 따르면, 입출력 단자를 통해 다른 미디어장치와 자유롭게 연동이 가능한 분야 적응형 휴대용 방송자막 기계번역 장치를 구현할 수 있을 뿐만 아니라, 다양한 분야의 문장에 대하여 번역 성능의 향상을 도모할 수 있는 효과가 있다.
    기계번역 장치, 방송자막, 번역패턴

    병렬 말뭉치를 이용한 신조어의 대역어 자동 선정 방법 및장치
    148.
    发明公开
    병렬 말뭉치를 이용한 신조어의 대역어 자동 선정 방법 및장치 失效
    自动选择使用双胞胎的新词相关翻译的方法和装置

    公开(公告)号:KR1020080029567A

    公开(公告)日:2008-04-03

    申请号:KR1020060096341

    申请日:2006-09-29

    Abstract: A method and an apparatus for automatically selecting a translated word for a new coined word by using a bilingual corpus are provided to construct efficiently a bilingual translation dictionary. A method and an apparatus for automatically selecting a translated word for a new coined word comprises the following several steps. A morpheme and a structure analysis are performed with respect to sentences made of an original language, a lexical category analysis for words included in the sentences is analyzed and a grammar relation among words is determined(110). A unregistered word, which does not exist in a bilingual translation dictionary, is extracted from words in sentences made of the original language(120). Neighboring words related to the extracted unregistered word are selected from the sentences made of the original language(130). Translated words corresponding to the neighboring words are eliminated from translated sentences made of a target language, and remaining words are selected as translated words for the unregistered words(140). The unregistered words and the selected translated words are registered in the bilingual translation dictionary as new entries(150).

    Abstract translation: 提供了一种通过使用双语语料库自动选择新的创造词的翻译单词的方法和装置,以有效地构建双语翻译词典。 用于自动选择新的创造词的翻译单词的方法和装置包括以下几个步骤。 对原始语言句子进行词素和结构分析,对包含在句子中的单词进行词法分类分析,确定单词之间的语法关系(110)。 在双语翻译字典中不存在的未注册词是从原文语言(120)中的单词中提取出来的。 从原始语言(130)中选择与提取的未注册词相关的相关词。 对应于相邻单词的翻译字从消除由目标语言构成的翻译句子中消除,并且剩余单词被选择为未注册单词(140)的翻译单词。 未登记的单词和所选择的翻译单词在双语翻译字典中被注册为新的条目(150)。

    병렬 구조 인식을 통한 구문 분석 장치 및 방법
    149.
    发明公开
    병렬 구조 인식을 통한 구문 분석 장치 및 방법 无效
    使用并行结构检测的装置和方法进行统计分析

    公开(公告)号:KR1020080024638A

    公开(公告)日:2008-03-19

    申请号:KR1020060089008

    申请日:2006-09-14

    CPC classification number: G06F17/271

    Abstract: A device and a method for analyzing syntax by recognizing a parallel structure are provided to divide excessively long sentences found in a patent document with high correctness, and raise syntax analysis efficiency/correctness by dividing the sentence into more syntaxes. A chunking part(100) tags and partially parses an inputted raw English document. A node recognizer(200) recognizes a parallel node starting point of the raw document. A similarity calculator(300) calculates similarity weight among parallel nodes based on the similarity of vocabulary/part-of-speed of a starting word, a head, and the word next to the head. A parallel structure recognizer(400) searches all available parallel structures based on the calculated similarity weight, calculates the weight of the searched parallel structures, and recognizes the parallel structure of the raw document based on the calculated weight of the parallel structure. A parallel structure parser(500) parses the recognized parallel structure. A whole sentence parser(600) parses the whole raw sentence again which is inputted from a parsing result.

    Abstract translation: 提供一种用于通过识别并行结构来分析语法的装置和方法,以高精度地划分专利文件中发现的较长的句子,并通过将句子分为更多语法来提高语法分析的效率/正确性。 分块部分(100)标记并部分地分析输入的原始英文文档。 节点识别器(200)识别原始文档的并行节点起始点。 相似度计算器(300)基于起始词,头部和头部旁边的单词的词汇/部分速度的相似度,计算并行节点之间的相似度权重。 并行结构识别器(400)基于所计算的相似度权重搜索所有可用的并行结构,计算所搜索的并行结构的权重,并且基于所计算的并行结构的权重来识别原始文档的并行结构。 并行结构解析器(500)解析识别的并行结构。 整个句子解析器(600)解析从解析结果输入的整个原始句子。

    의미공기정보 지식베이스 구축 방법 및 장치
    150.
    发明授权
    의미공기정보 지식베이스 구축 방법 및 장치 失效
    构建语义同现模式数据库的方法与装置

    公开(公告)号:KR100784441B1

    公开(公告)日:2007-12-11

    申请号:KR1020060060374

    申请日:2006-06-30

    Abstract: 본 발명은 (a)제1 어휘공기정보 지식베이스와 명사 의미 코드 사전을 이용하여 중의성이 없는 제1 의미공기정보 지식베이스와 중의성이 존재하는 제2 의미공기정보 지식베이스를 구축하고, (b)상기 제1 및 제2 의미공기정보 지식베이스에 포함된 각 어휘공기정보의 빈도수를 이용하여 제2 어휘공기정보 지식베이스를 구축하고, (c)상기 제1 및 제2 의미공기정보지식베이스에서 상기 제2 어휘공기정보 지식베이스로 이동한 어휘공기정보를 각각 제거하여 제3 및 제4 의미공기정보 지식베이스를 구축하고, (d)상기 구축된 제3 및 제4 의미공기정보 지식베이스를 이용하여 상기 제4 의미공기정보 지식베이스에 존재하는 중의성을 감소시켜 중의성이 감소된 제5 의미공기정보 지식베이스 및 중의성이 없는 제6 의미공기정보 지식베이스를 구축하고, (e)상기 제5 및 제6 의미공기정보 지식베이스에 포함된 각 어휘공기정보의 빈도수를 조정하여 최종 의미공기정보 지식베이스를 구축하는 것으로서, 구조적 중의성 해소와 동시에 명사의 의미를 결정할 수 있으므로, 구조적 중의성 해소의 정확성 향상에 따라, 의미적 중의성 해소 정확도를 향상시킬 수 있다.
    코퍼스, 의미공기정보, 어휘공기정보, 중의성

Patent Agency Ranking