-
公开(公告)号:KR1020110028077A
公开(公告)日:2011-03-17
申请号:KR1020090085995
申请日:2009-09-11
Applicant: 한국과학기술원
CPC classification number: G06F17/30734 , G06F17/30684
Abstract: PURPOSE: An automatic annotation system and a method thereof are provided to generate a sentence ontology using corpus are provided to an input sentence and search a sentence similar to an input sentence from the corpus. CONSTITUTION: A disassembling/storing unit stores annotated sentences of corpus including Penn-Treebank. An annotator searches a piece having similar meaning and annotates an input sentence to the piece with reference to the annotated contents. The sentence is disassembled to the pieces around the verb.
Abstract translation: 目的:提供一种自动注释系统及其方法来生成使用语料库的句子本体提供给输入句子,并从语料库中搜索类似于输入句子的句子。 构成:反汇编/存储单元存储包括Penn-Treebank在内的语料库的注释句子。 注释器搜索具有相似意义的部分,并参照注释内容向该片段注释输入句子。 句子被分解成动词周围的部分。
-
公开(公告)号:KR101176772B1
公开(公告)日:2012-08-23
申请号:KR1020090085995
申请日:2009-09-11
Applicant: 한국과학기술원
Abstract: 본 발명은 문장 온톨로지 생성을 위한 자동 어노테이션 시스템 및 방법에 관한 것으로, 본 발명에 따른 문장 온톨로지 생성을 위한 자동 어노테이션 시스템은 코퍼스의 어노테이션된 문장들을 적당한 단위로 분해해서 저장하는 분해 저장부, 입력 문장이 들어왔을 때, 상기 분해 저장부로부터 분해된 문장 조각중에 의미, 구조적으로 유사한 조각을 찾아 해당 조각에 어노테이션된 내용을 참조하여 입력문장을 어노테이션하는 어노테이션부를 포함한다.
또한, 본 발명에 따른 문장의 부분 유사도 기반 어노테이션 방법은 문장을 비교 가능한 단위로 분해하는 제1 과정, 상기 문장 조각의 구조적 유사도를 측정하는 제2 과정, 논항들이 의미상으로 얼마나 유사한지 알아보기 위해 상기 문장 조각의 의미적 유사도를 측정하는 제3 과정, 및 상기 문장 유사도를 기반으로 하여 어노테이션을 수행하는 제4 과정을 포함한다.
온톨로지, 어노테이션, 코퍼스, 도메인, 문장 유사도, 문장 분해-
公开(公告)号:KR1020110028063A
公开(公告)日:2011-03-17
申请号:KR1020090085974
申请日:2009-09-11
Applicant: 한국과학기술원
CPC classification number: G06F17/30734 , G06F17/2247 , G06F17/2705
Abstract: PURPOSE: A method for converting a sentence into ontology which conserves an original meaning of the sentence is provided to express an ontology form of high accuracy by converting the sentence into ontology. CONSTITUTION: A natural language process includes a parsing step for tagging a structure, a predicate-argument structure and preposition phrase analysis step and an anaphora resolution step. The sentence which is processed in the natural language is expressed in an ontology form. The sentence, which is expressed in the ontology, is mapped to an upper ontology.
Abstract translation: 目的:提供一种将句子转换为本体的方法,保留句子的原始含义,通过将句子转换为本体来表达高精度的本体形式。 构成:自然语言过程包括用于标记结构的解析步骤,谓词参数结构和介词短语分析步骤以及简单解析步骤。 以自然语言处理的句子以本体形式表示。 在本体论中表达的句子被映射到上层本体。
-
-