형태적 중의성 동사 분석 장치, 방법 및 그 기록 매체
    1.
    发明授权
    형태적 중의성 동사 분석 장치, 방법 및 그 기록 매체 有权
    用于消除形态上含糊的韩语动词的装置和方法及其记录介质

    公开(公告)号:KR101126186B1

    公开(公告)日:2012-03-22

    申请号:KR1020100086449

    申请日:2010-09-03

    Abstract: 형태적 중의성이 존재하는 동사 분석 장치, 방법 및 그 기록 매체가 개시된다. 본 발명의 일 실시 예에 따른 형태적 중의성이 있는 동사 분석 장치는 레이블이 부착되지 않은 가공되지 않은 말뭉치에서 기본형이 파악된 중의성이 없는 제1동사활용과 상기 제1동사활용에 관련된 문맥 특징을 포함하는 학습 데이터를 수집하는 기본 데이터 수집부; 및 상기 학습 데이터에 기반하여 기본형과 문맥 사이의 분류자를 학습하는 훈련 수행부; 및 상기 말뭉치에서 기본형이 중의적인 제2동사활용 주변의 문맥 특징을 추출하고, 상기 학습된 분류자에 기반하여 기본형을 파악하는 동사 분석부; 기존 학습 데이터로 유도된 분류자로는 판단하기 어려운 예제를 파악하는 어려운 사례 판단부; 어려운 사례에 대한 기본형 판단을 위한 웹카운트를 수집하는 통신부; 어려운 사례를 추가하고 재학습하는 추가 훈련부를 포함한다. 본 발명의 실시 예들에 의하면, 말뭉치의 인위적인 분류 작업을 필요로 하지 않으면서도 텍스트 분석의 정확도 및 효율을 향상시킬 수 있고, 데이터베이스 구축을 포함한 텍스트 분석의 전 과정을 자동화할 수 있다.

    형태적 중의성 동사 분석 장치, 방법 및 그 기록 매체
    2.
    发明公开
    형태적 중의성 동사 분석 장치, 방법 및 그 기록 매체 有权
    用于排除形态学上的韩文VERBS的装置和方法及其记录介质

    公开(公告)号:KR1020120023387A

    公开(公告)日:2012-03-13

    申请号:KR1020100086449

    申请日:2010-09-03

    CPC classification number: G06F17/2755 G06F17/274

    Abstract: PURPOSE: A morphological ambiguous verb analysis apparatus, method, and recording medium thereof are provided to improve the accuracy of text analysis by reducing numbers of an artificial classification work. CONSTITUTION: A basic data collecting unit(120) collects learning data(130) from a non-processed language corpus(110). The learning data includes first verb utilization and a context feature related to the first verb utilization. A training execution unit(140) learns a classifier in order to match the second verb utilization with a basic type based on the learning data. A verb analysis unit(150) determines the basic type of the verb by using the classifier and by extracting the context feature from texts.

    Abstract translation: 目的:提供一种形态上含糊的动词分析装置,方法和记录介质,通过减少人工分类工作的数量来提高文本分析的准确性。 构成:基本数据收集单元(120)从非处理语言语料库(110)收集学习数据(130)。 学习数据包括第一动词利用和与第一动词利用相关的上下文特征。 训练执行单元(140)学习分类器以便基于学习数据将第二动词利用与基本类型相匹配。 动词分析单元(150)通过使用分类器并通过从文本中提取上下文特征来确定动词的基本类型。

    바이오 텍스트 데이터로부터 개체 간의 관계를 도출하는 방법
    3.
    发明授权
    바이오 텍스트 데이터로부터 개체 간의 관계를 도출하는 방법 有权
    从生物医学文本数据中提取实体之间的关系的方法

    公开(公告)号:KR101246101B1

    公开(公告)日:2013-03-20

    申请号:KR1020100082549

    申请日:2010-08-25

    Abstract: 본 발명은 바이오 텍스트 데이터로부터 개체 간의 관계를 도출하는 방법에 관한 것으로서, 텍스트 내의 문장들을 파싱하여 각 문장별로 단어들 간의 문법적 의존 그래프를 생성하고, 생성된 의존 그래프에서 두 개 이상의 개체를 연결하는 최단 의존 경로를 도출하고, 최단 의존 경로로부터 두 개 이상의 개체 간의 관계를 학습하는데 필요한 인스턴스를 생성하고, 생성된 인스턴스들로부터 서브 구조들을 생성하고, 생성된 서브 구조들을 이용하여 두 개 이상의 개체 간의 유사도를 측정하고, 측정된 유사도로부터 두 개 이상의 개체 간의 관계를 도출함으로써, raw 텍스트 데이터로부터 양질의 개체 간의 관계를 도출하여 자동으로 새로운 정보를 업데이트하고, 추출할 수 있는 수단을 제공할 수 있다.

    바이오 텍스트 데이터로부터 개체 간의 관계를 도출하는 방법
    4.
    发明公开
    바이오 텍스트 데이터로부터 개체 간의 관계를 도출하는 방법 有权
    从生物医学文本数据中提取实体之间的关系的方法

    公开(公告)号:KR1020120019245A

    公开(公告)日:2012-03-06

    申请号:KR1020100082549

    申请日:2010-08-25

    Abstract: PURPOSE: A deduction method is provided to automatically update or extract information by deducing relationships between objects from raw text data. CONSTITUTION: A grammatical dependency graph is created by analyzing sentences within a document(1410). The shortest dependent path which connects objects is deduced from the grammatical dependency graph(1420). An instance which is necessary to learn a relationship between objects is created from the shortest dependency path(1430). A sub structure is created from the instance. The objects are measured by using the sub structure(1440). The relationship between objects is deduced from the similarity(1450).

    Abstract translation: 目的:提供一种扣除方式,通过从原始文本数据中推导出对象之间的关系来自动更新或提取信息。 构成:通过分析文档中的句子创建语法依赖图(1410)。 从语法依赖图(1420)推导出连接对象的最短依赖路径。 从最短依赖路径(1430)创建学习对象之间关系所必需的实例。 从实例创建子结构。 通过使用子结构(1440)测量对象。 对象之间的关系是从相似性推导出来的(1450)。

Patent Agency Ranking