한국어 개방형 정보 추출 방법 및 이를 수행하는 프로그램을 기록한 기록매체
    21.
    发明授权
    한국어 개방형 정보 추출 방법 및 이를 수행하는 프로그램을 기록한 기록매체 失效
    提供韩国开放信息的方法和具有执行程序的记录媒体

    公开(公告)号:KR101180589B1

    公开(公告)日:2012-09-06

    申请号:KR1020110029825

    申请日:2011-03-31

    CPC classification number: G06F17/2705

    Abstract: PURPOSE: A Korean open type information extracting method and program readable recording medium are provided to reduce costs necessary for generation of a corpus by learning a Korean open type information extracting model. CONSTITUTION: A Korean open information extractor generates a first corpus by application of syntax rules for an inputted Korean syntax analysis corpus(420,430). The apparatus extracts English information about English information of Korean-English parallel corpus(450). The apparatus generates a second corpus from a Korean sentence(460). The apparatus learns a Korean open information extraction model by using the first and second corpuses(470).

    Abstract translation: 目的:提供韩国开放式信息提取方法和程序可读记录介质,以通过学习韩国开放式信息提取模型来降低产生语料库所需的成本。 构成:韩国公开信息提取器通过应用输入的韩语语法分析语料库(420,430)的语法规则生成第一语料库。 该设备提取英文韩文 - 英文平行语料库信息(450)。 该装置从韩国语句产生第二语料库(460)。 该装置通过使用第一和第二语料库(470)来学习韩国开放信息提取模型。

    데이터 수집 시스템 및 방법
    22.
    发明公开
    데이터 수집 시스템 및 방법 失效
    用于收集数据的系统和方法

    公开(公告)号:KR1020110049143A

    公开(公告)日:2011-05-12

    申请号:KR1020090106011

    申请日:2009-11-04

    Abstract: PURPOSE: A data acquisition system and a method thereof are provided to collect user data through a communication interface which is developed based on an initially collected data. CONSTITUTION: A first terminal(10) offers input data of a user(U1) to a second terminal(20). The second terminal outputs various data of the first terminal and text data of a voice recognition error generator(50). A third terminal(40) provides text input data to the voice recognition error generator or a voice composition unit(30). The voice composition part converts the text data of the second and the third terminal into a voice data. The voice recognition error generator offers the error-added text data to the second terminal.

    Abstract translation: 目的:提供数据采集系统及其方法,以通过基于最初收集的数据开发的通信接口来收集用户数据。 构成:第一终端(10)将用户(U1)的输入数据提供给第二终端(20)。 第二终端输出语音识别误差发生器(50)的第一终端的各种数据和文本数据。 第三终端(40)向语音识别错误发生器或语音合成单元(30)提供文本输入数据。 语音合成部分将第二和第三终端的文本数据转换为语音数据。 语音识别错误发生器向第二终端提供错误添加的文本数据。

    사용자 시뮬레이션 시스템 및 방법
    23.
    发明公开
    사용자 시뮬레이션 시스템 및 방법 失效
    用户仿真系统及方法

    公开(公告)号:KR1020110048752A

    公开(公告)日:2011-05-12

    申请号:KR1020090105456

    申请日:2009-11-03

    CPC classification number: G10L15/01 G10L15/22

    Abstract: PURPOSE: A user simulation system and a method thereof are provided to evaluate a chatting system in short time by creating various user languages. CONSTITUTION: A user intention generator(112) generates a purpose of a user using a conditional random field model. A surface language generator(114) creates a sentence by the purpose of the user and extracts a speaking sentence from a word string. A user purpose generating unit produces a probability value by the conditional random field model about user purpose candidate sets. The user purpose generating unit creates the purpose of a user by extracting one of the user purpose candidate sets.

    Abstract translation: 目的:提供用户模拟系统及其方法,以通过创建各种用户语言在短时间内评估聊天系统。 构成:用户意图生成器(112)使用条件随机场模型生成用户的目的。 表面语言生成器(114)通过用户的目的创建一个句子,并从单词串中提取一个口语。 用户目的生成单元通过关于用户目的候选集的条件随机场模型产生概率值。 用户目的生成单元通过提取用户目的候选集之一来创建用户的目的。

    워크벤치 기반의 생물학적 개체명 인식 방법 및 시스템
    24.
    发明授权
    워크벤치 기반의 생물학적 개체명 인식 방법 및 시스템 失效
    基于工作台识别生物命名实体的方法和系统

    公开(公告)号:KR100825687B1

    公开(公告)日:2008-04-29

    申请号:KR1020060021875

    申请日:2006-03-08

    Abstract: 본 발명은 생물학 문헌으로부터 생물학적 개체명을 자동으로 인식하기 위한 워크벤치 기반의 생물학적 개체명 인식 방법 및 시스템을 제공한다. 상기 본 발명에 따른 워크벤치 기반의 생물학적 개체명 인식 방법은 생물학적 개체명을 인식하고자 하는 생물학 문서를 수신하는 단계; 생물학적 개체명 인식 모델을 이용하여 상기 수신된 생물학 문서로부터 생물학적 개체명을 인식하는 단계; 상기 생물학적 개체명 인식 결과의 교정이 필요한 경우 교정된 자료를 수신하는 단계; 상기 교정된 자료를 기초로 기계 학습을 하는 단계; 및 상기 기계 학습의 결과를 생물학적 개체명 인식 모델에 적용하는 단계;를 포함한다. 본 발명에 따르면 생물학적 개체명을 통계 기반의 방식을 사용하여 자동적으로 인식하는데 있어서 생물학 문헌 학습 코퍼스(corpus)를 구축하기 위해 필요한 비용을 줄이며, 개체명 인식 성능을 지속적으로 향상시킬 수 있다.
    생물학적 개체명, 개체명 인식, 워크벤치

Patent Agency Ranking