-
公开(公告)号:KR1020090048319A
公开(公告)日:2009-05-13
申请号:KR1020080104184
申请日:2008-10-23
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2755 , G06F17/2264 , G06F17/2785
Abstract: 본 발명은 명사가 여러 게 나열되는 복합 명사 내부의 의미 구조 분석을 통해 의미의 왜곡이 없는 문장 형태로 변환하여, 명사가 나열된 형태에서 생략된 문장 성분을 자동으로 복원하여 의미 왜곡이 없는 문장으로 생성하는 문장 성분 복원 장치 및 그 방법에 관한 것이다. 본 발명에 의해, 분석된 복합 명사의 의미 구조를 바탕으로 의미를 왜곡시키지 않으면서, 다른 형태의 표현을 생성할 수 있게 된다.
-
公开(公告)号:KR101309839B1
公开(公告)日:2013-09-23
申请号:KR1020090118298
申请日:2009-12-02
Applicant: 한국전자통신연구원
Abstract: 본 발명은 통계 정보를 이용한 규칙 기반 구문 분석 장치 및 방법에 관한 것으로, 본 발명의 일실시 예에 따른 통계정보를 이용한 규칙 기반 구문분석 방법은, 입력 문장에 대해 구문 규칙을 적용함으로써 구문 분석을 수행하는 단계; 상기 입력 문장에 대해 적용되는 규칙에 주어진 규칙 확률과 어휘통계정보에 기반하여 계산된 어휘 의존 가중치를 이용하여 상기 규칙에 대한 규칙 가중치를 계산하는 단계; 각 구문트리에 사용된 규칙에 대해 계산된 상기 규칙 가중치들을 곱하여 각 구문트리의 가중치를 계산하고 가장 높은 가중치를 갖는 구문 트리를 선택하는 단계; 및 상기 선택된 구문 트리를 출력하는 단계를 포함한다.
상술한 바와 같은 본 발명은, 규칙기반 방식의 효율성과 통계기반 방식의 높은 모호성 처리 성능을 갖는 구문분석이 가능하다.
언어 처리, 구문 분석, 통계 정보, 규칙 기반-
公开(公告)号:KR1020110067276A
公开(公告)日:2011-06-22
申请号:KR1020090123802
申请日:2009-12-14
Applicant: 한국전자통신연구원
CPC classification number: G06F17/278 , G06F17/2755 , G06F17/2863
Abstract: PURPOSE: A Korean language analyzing apparatus is provided to improve the efficiency of analyzing a noun phrase structure by determining noun phrase analysis candidates on the basis of a noun vocabulary pattern and a verb phrase pattern. CONSTITUTION: The inflected word expression/vocabulary pattern building block [verb phrase/vocabulary pattern building block](102) uses the sentences of the analysis object domain. The inflected word expression pattern and vocabulary pattern are away driven. A verb phrase/vocabulary pattern building block builds verb phrase patterns and vocabulary patterns using the sentences in a domain to be analyzed. An analysis candidate generating block(104) generates noun phrase analysis candidates by searching for a noun that can be a declinable word from the noun phrase sentence to be analyzed. A priority determining block(108) produces a preference from the established vocabulary patterns and determines the priority of the noun phrase analysis candidates. An analysis candidate selecting block(110) determines on noun phrase analysis candidate in consideration of the preference and inter-noun restriction.
Abstract translation: 目的:提供韩语分析装置,以通过基于名词词汇模式和动词短语模式确定名词短语分析候选来提高分析名词短语结构的效率。 构成:词汇表达/词汇模式构建块[动词短语/词汇模式构建块](102)使用分析对象域的句子。 转折词表达模式和词汇模式被驱逐。 动词短语/词汇模式构建块使用要分析的域中的句子构建动词短语模式和词汇模式。 分析候选生成块(104)通过从要分析的名词短语句中搜索可以是可拒绝词的名词来生成名词短语分析候选。 优先级确定块(108)从所建立的词汇模式产生偏好,并确定名词短语分析候选者的优先级。 考虑到偏好和名词之间的限制,分析候选选择块(110)确定名词短语分析候选者。
-
公开(公告)号:KR1020110062867A
公开(公告)日:2011-06-10
申请号:KR1020090119720
申请日:2009-12-04
Applicant: 한국전자통신연구원
CPC classification number: G06F17/30539 , G06F17/2735 , G06F17/2755 , G06F17/2863
Abstract: PURPOSE: A source language-object language term list constructing apparatus and method thereof are provided to construct an original language-object language term list through mining of a search result through an intermediate language. CONSTITUTION: A document search unit(105) collects a search result including an original language. A data mining unit(107) extracts intermediate language parallel sentence or a word. A morpheme analysis unit(109) analyzes an extracted original language-middle language parallel sentence. A word alignment unit(111) aligns the language parallel sentence. A term generator(113) generates an original language term list.
Abstract translation: 目的:提供源语言对象语言词列表构造装置及其方法,以通过中间语言挖掘搜索结果来构建原始语言对象语言词列表。 构成:文件搜索单元(105)收集包括原始语言的搜索结果。 数据挖掘单元(107)提取中间语言并行语句或单词。 语素分析单元(109)分析提取的原始语言 - 中间语言并行语句。 字对齐单元(111)对齐语言并行句。 术语生成器(113)生成原始语言项列表。
-
公开(公告)号:KR1020110057632A
公开(公告)日:2011-06-01
申请号:KR1020090114108
申请日:2009-11-24
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2863 , G06F17/218 , G06F17/271 , G06F17/2785
Abstract: PURPOSE: A Chinese translation apparatus and method thereof which uses syntax analysis information are provided to determine a Chinese sentence pattern by using syntax analysis information of a tagged Chinese sentence. CONSTITUTION: An input unit(102) performs segmentation and tagging of Chinese sentence and analyzes a syntax. A sentence pattern determining unit(104) uses a sentence pattern decision rule about the sentence analysis result. A transform unit(112) converts a Chinese sentence according to the sentence type. A terminative ending generating unit(114) generates terminative ending production rule corresponding to a sentence type.
Abstract translation: 目的:提供一种使用语法分析信息的中文翻译装置及其方法,通过使用标记中文句子的语法分析信息来确定中文句型。 构成:输入单元(102)执行中文句子的分割和标记,并分析语法。 句子模式确定单元(104)使用关于句子分析结果的句子模式决定规则。 变换单元(112)根据句型转换中文句子。 终端生成单元(114)生成与句型对应的终止生成规则。
-
公开(公告)号:KR1020110057495A
公开(公告)日:2011-06-01
申请号:KR1020090113923
申请日:2009-11-24
Applicant: 한국전자통신연구원
Abstract: PURPOSE: A method and device for segmenting a Chinese language are provided to phrase analysis accuracy and phrase analysis performance of Chinese based on phrase rule by performing a phrase segmentation based on Chinese contextual information. CONSTITUTION: A segmentation parameter setting unit(100) establishes a segment parameter about a sentence of Chinese in which morpheme is analyzed. A segment location estimating unit(102) presumes segment-available location and a maximum segment number about a Chinese sentence which the segment parameter is set.
Abstract translation: 目的:通过基于中文语境信息进行短语分割,提供了一种基于短语规则的汉语分词准确度和短语分析性能的方法和设备。 构成:细分参数设定单元(100)建立关于语素被分析的汉语句子的分段参数。 段位置估计单元(102)假设段可用位置和关于段参数被设置的中文句子的最大段号。
-
公开(公告)号:KR1020110028123A
公开(公告)日:2011-03-17
申请号:KR1020090086064
申请日:2009-09-11
Applicant: 한국전자통신연구원
CPC classification number: G06F17/289 , G06K9/2081 , G06K2209/01
Abstract: PURPOSE: An automatic translation apparatus and a method thereof using a user interaction of a mobile apparatus which modifies the error of a text are provided to increase the level of an automatic translation result and to modify the recognition error about the text through user feedback. CONSTITUTION: An text recognition controller(103) designates a target character string area through a user interaction in a digital image and performs the character recognition through an OCR(Optical Character Recognition). A text transmission controller(105) transmits the text character string. An automatic translation controller(107) generates a translation of the character string by using automatic translation knowledge database.
Abstract translation: 目的:提供一种使用修改文本错误的移动装置的用户交互的自动翻译装置及其方法,以增加自动翻译结果的级别,并通过用户反馈修改关于文本的识别错误。 构成:文本识别控制器(103)通过数字图像中的用户交互来指定目标字符串区域,并通过OCR(光学字符识别)执行字符识别。 文本传输控制器(105)发送文本字符串。 自动翻译控制器(107)通过使用自动翻译知识数据库生成字符串的翻译。
-
公开(公告)号:KR1020110027361A
公开(公告)日:2011-03-16
申请号:KR1020090085422
申请日:2009-09-10
Applicant: 한국전자통신연구원
CPC classification number: G06F17/2836
Abstract: PURPOSE: An automatic translation system based on TM and a method thereof, capable of increasing coverage by TM are provided to increase the quality of translation by changing TM consisting of a character string into a configured TM. CONSTITUTION: A TM building module(106) converts a language pattern into a partial translation pattern and registers the partial translation pattern into TM database. A partial combination translation module(20) analyzes the structure of a language pattern with reference to the TM database and searches the partial translation pattern. The partial combination translation module combines the partial translation pattern and outputs a translation corresponding to an input statement.
Abstract translation: 目的:提供一种基于TM的自动翻译系统及其方法,其能够增加TM的覆盖率,以通过将由字符串组成的TM变更为配置的TM来提高翻译质量。 构成:TM构建模块(106)将语言模式转换为部分翻译模式,并将部分翻译模式注册到TM数据库中。 部分组合翻译模块(20)参考TM数据库分析语言模式的结构,并搜索部分翻译模式。 部分组合翻译模块组合部分翻译模式并输出与输入语句对应的翻译。
-
公开(公告)号:KR1020110018717A
公开(公告)日:2011-02-24
申请号:KR1020090076321
申请日:2009-08-18
Applicant: 한국전자통신연구원
CPC classification number: G06F17/274 , G06F17/2725 , G06F17/2872
Abstract: PURPOSE: An automatic correction apparatus of a Chinese structural postposition and a method thereof for automatically selecting a structural postposition by the conversion regulation of the structural postposition are provided to improve Chinese translation quality by efficiently correcting a Chinese sentence in an automatic translation system. CONSTITUTION: An error detection unit(112) detects the use error of a structural postposition by using the distribution regulation DB of a structural postposition by inputting a Chinese sentence. An error correction unit(122) performs the correction of the sentence with reference to the translation regulation DB of the structural postposition.
Abstract translation: 目的:提供一种中国结构性后置自动修正装置及其通过结构性后缀转换规则自动选择结构性后缀的方法,通过有效地修正自动翻译系统中的中文句子来提高中文翻译质量。 构成:错误检测单元(112)通过使用输入中文句子的结构后置的分布调节DB来检测结构后置的使用错误。 错误校正单元(122)参照结构化后缀的翻译规则DB执行句子的校正。
-
公开(公告)号:KR100911619B1
公开(公告)日:2009-08-12
申请号:KR1020070128564
申请日:2007-12-11
Applicant: 한국전자통신연구원
IPC: G06F17/28
Abstract: 본 발명은 자동번역을 위한 영어 어휘 패턴을 구축하는데 있어서, 원시 코퍼스(source corpus)로부터 어휘패턴 후보를 자동으로 추출하고, 추출된 어휘패턴 후보에 대해 사람이 어휘패턴을 구축할 수 있도록 지원하여, 적은 노력으로 필요한 어휘패턴을 구축할 수 있도록 하는 자동번역을 위한 영어 어휘패턴 구축 기술에 관한 것이다. 본 발명은 원시 코퍼스에 대해 품사 태깅(tagging)을 수행하는 태깅 단계, 패턴범위 후보인식 단계, 필터링 단계, 패턴 저장 단계, 빈도수 조정 단계, 어휘 패턴 구축 지원 단계로 구성되는 것을 특징으로 한다.
어휘 패턴, 지식 구축, 기계번역, 구문분석
-
-
-
-
-
-
-
-
-