-
公开(公告)号:KR1020070092005A
公开(公告)日:2007-09-12
申请号:KR1020060021875
申请日:2006-03-08
Applicant: 학교법인 포항공과대학교 , 포항공과대학교 산학협력단
CPC classification number: G06F17/278 , G06F17/24
Abstract: A method and a system for recognizing a biological entity name based on a workbench are provided to reduce expense for constructing a biological document learning corpus and enhance entity name recognition for automatically extracting the biological entity name from a biological document on the basis of the workbench. An entity name recognizer(12) recognizes the biological entity name from the biological document by using a biological entity name recognition model(16). An entity name corrector(14) receives and corrects corrected data if a biological entity name recognition result needs correction. A machine learning part(15) constructs the new biological entity name recognition module by performing machine learning for a corrected result. The biological entity name recognition module is a statistics-based biological entity name recognition model constructed by the machine learning based on the biological document learning corpus. A document receiver(11) receives the biological document and an entity name recognition result output part(13) provides the recognition result to a user. A correction database(18) receives and stores the corrected data if the biological entity name recognition result needs the correction.
Abstract translation: 提供了一种用于基于工作台识别生物实体名称的方法和系统,以减少构建生物文献学习语料库的费用,并增强实体名称识别,以便根据工作台从生物文件自动提取生物实体名称。 实体名称识别器(12)通过使用生物实体名称识别模型(16)从生物文件识别生物实体名称。 如果生物实体名称识别结果需要校正,则实体名称校正器(14)接收并校正校正数据。 机器学习部分(15)通过执行校正结果的机器学习来构建新的生物实体名称识别模块。 生物实体名称识别模块是基于生物学文档学习语言的机器学习构建的基于统计的生物实体名称识别模型。 文档接收器(11)接收生物文档,并且实体名称识别结果输出部分(13)向用户提供识别结果。 如果生物实体名称识别结果需要校正,校正数据库(18)接收并存储校正数据。
-
公开(公告)号:KR100825687B1
公开(公告)日:2008-04-29
申请号:KR1020060021875
申请日:2006-03-08
Applicant: 학교법인 포항공과대학교 , 포항공과대학교 산학협력단
Abstract: 본 발명은 생물학 문헌으로부터 생물학적 개체명을 자동으로 인식하기 위한 워크벤치 기반의 생물학적 개체명 인식 방법 및 시스템을 제공한다. 상기 본 발명에 따른 워크벤치 기반의 생물학적 개체명 인식 방법은 생물학적 개체명을 인식하고자 하는 생물학 문서를 수신하는 단계; 생물학적 개체명 인식 모델을 이용하여 상기 수신된 생물학 문서로부터 생물학적 개체명을 인식하는 단계; 상기 생물학적 개체명 인식 결과의 교정이 필요한 경우 교정된 자료를 수신하는 단계; 상기 교정된 자료를 기초로 기계 학습을 하는 단계; 및 상기 기계 학습의 결과를 생물학적 개체명 인식 모델에 적용하는 단계;를 포함한다. 본 발명에 따르면 생물학적 개체명을 통계 기반의 방식을 사용하여 자동적으로 인식하는데 있어서 생물학 문헌 학습 코퍼스(corpus)를 구축하기 위해 필요한 비용을 줄이며, 개체명 인식 성능을 지속적으로 향상시킬 수 있다.
생물학적 개체명, 개체명 인식, 워크벤치
-