확장 마크업 언어로 작성된 문서를 위한 정보검색 시스템및 그 방법과 그 방법을 실행시키기 위한 프로그램을기록한 컴퓨터로 읽을 수 있는 기록매체
    21.
    发明公开

    公开(公告)号:KR1020060005236A

    公开(公告)日:2006-01-17

    申请号:KR1020040054131

    申请日:2004-07-12

    CPC classification number: G06F17/227 G06F17/2247 G06F17/30914

    Abstract: 본 발명은 확장 마크업 언어로 작성된 XML 문서의 계층적 구조를 손상시키지 않고 유지시키면서 단층적인 구조를 지니는 단편화된 XML 문서로 변환시켜주는 XML 문서를 위한 정보검색 시스템 및 그 방법과 그 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 것을 목적으로 한다.
    상기 목적을 달성하기 위하여 본 발명은 본 발명은 확장 마크업 언어(XML)로 작성된 XML 원본문서를 위한 정보검색 방법에 있어서,(A) 상하구조로 형성된 복수의 계층들을 지니며 각각의 계층을 구성하는 복수의 노드들은 트리구조를 갖는 XML 원본문서가 복수의 변경노드들이 단층적인 트리구조를 형성하여 이루어진 XML 변경문서로 변환되는 단계, (B) 상기 (A) 단계에 의해 변환된 XML 변경문서가 저장되는 단계, (C) 상기 (B) 단계에 저장된 XML 변경문서에 기재된 정보 중에서 원하는 정보가 기재된 상기 변경노드가 검색되는 단계 및 (D) 상기 (C) 단계에 의하여 검색된 상기 변경노드가 상기 XML 원본문서가 지니는 계층적인 트리구조에 대응되어 출력되는 단계를 포함하여 구성된 것을 일 특징으로 한다.
    상기와 같은 구성에 의해 본 발명은 XML 문서의 구조적 정보를 상실하지 않고 원문의 구조 정보를 유지하면서 XML 문서를 관리할 수 있도록 하며, 효과적인 질의처리를 돕고 빠른 구조검색이 가능토록 하고, 그 검색결과를 사용자에게 입체적 검색결과로 제공하는 효과를 지닌다.
    XML 원본문서, XML 변경문서, 계층, 단층, 트리구조, DTD, 단편화 알고리즘

    하이브리드 규칙 추론 장치 및 그 방법
    25.
    发明授权
    하이브리드 규칙 추론 장치 및 그 방법 有权
    混合规则理由的装置和方法

    公开(公告)号:KR101535807B1

    公开(公告)日:2015-07-10

    申请号:KR1020140153763

    申请日:2014-11-06

    CPC classification number: G06N5/046

    Abstract: 본발명은하이브리드규칙추론장치및 방법에관한것으로, 입력된추론규칙을스키마규칙, 인스턴스규칙, 혼합규칙중 적어도하나의규칙으로분류하는추론규칙분류부, 스키마규칙을기 저장된스키마트리플에적용하여추론하고, 혼합규칙을스키마트리플에적용하여인스턴스규칙으로구체화하는메모리기반추론부, 상기메모리기반추론부에서구체화된인스턴스규칙또는상기추론규칙분류부에서분류된인스턴스규칙을기 저장된인스턴스트리플에적용하여추론하는디스크기반분산/병렬추론부를포함한다.

    Abstract translation: 本发明涉及一种用于推导混合规则的装置和方法。 该设备包括:推理规则分类单元,用于将输入的推理规则分类为模式规则,实例规则和混合规则中的至少一个; 基于存储器的推理单元,用于通过将模式规则应用于预存储的模式三进制来执行推理,并将混合规则应用于将被规定为实例规则的模式三元组; 以及基于盘的分配/并行推理单元,用于通过将基于存储器的推理单元中指定的实例规则或从推理规则分类单元分类的实例规则应用于预存储的实例三进制来执行推理。

    맵리듀스 기반 분산 병렬 개체 추출 시스템 및 방법
    26.
    发明授权
    맵리듀스 기반 분산 병렬 개체 추출 시스템 및 방법 有权
    基于MAPREDUCE提取分布式并发实体的系统和方法

    公开(公告)号:KR101255060B1

    公开(公告)日:2013-04-16

    申请号:KR1020120077379

    申请日:2012-07-16

    Abstract: PURPOSE: A MapReduce based dispersion parallel entity extracting system and a method thereof are provided to guarantee shortened entity extracting response time by extracting entity based on a MapReduce framework. CONSTITUTION: A master server device(100) distributes target document data to slave server devices(200a-200N) by dividing an input document into the target document data. The slave server device converts the target document data into a data format which is able to be processed in a MapReduce framework, divides the content of the converted document into sentences, and divides the divided sentences into construction units. The slave server device extracts the combination of the construction units as entity candidates and defines a relationship between the extracted entities. [Reference numerals] (100) Master server; (200a) Slave server 1; (200b) Slave server 2; (200N) Slave server N;

    Abstract translation: 目的:提供一种基于MapReduce的色散并行实体提取系统及其方法,以通过基于MapReduce框架提取实体来保证缩短的实体提取响应时间。 构成:主服务器设备(100)通过将输入文档划分为目标文档数据来将目标文档数据分发到从服务器设备(200a-200N)。 从服务器设备将目标文档数据转换为能够在MapReduce框架中处理的数据格式,将转换的文档的内容分为句子,并将分割的句子划分为构造单元。 从服务器设备将构建单元的组合提取为实体候选,并定义提取的实体之间的关系。 (附图标记)(100)主服务器; (200a)从服务器1; (200b)从服务器2; (200N)从服务器N;

    동사기반패턴을 이용한 대용량 문헌정보 내에서의 기술용어간 관계추출 시스템
    28.
    发明公开
    동사기반패턴을 이용한 대용량 문헌정보 내에서의 기술용어간 관계추출 시스템 有权
    使用基于VERB的图案提取大型采集技术条件之间的升高系统

    公开(公告)号:KR1020100054587A

    公开(公告)日:2010-05-25

    申请号:KR1020080113564

    申请日:2008-11-14

    CPC classification number: G06F17/30731 G06F17/30684

    Abstract: PURPOSE: A system for extracting relation between technical terms from bulk bibliographic information using a verb base pattern based on tama is provided to use a TAMA(Tech Association Mining Appliance) which recognizes relation between a technical term included in text and the technical terms, thereby extracting a verb based pattern centric relation from an abstract and bibliography database over science technique field. CONSTITUTION: If sentences extracted from database by using IIFP(Integrated Information & Function Provider) for STM(Scientific Tech Mining)(190) is applied, a TRD(Target Relation Determiner)(200) performs detailed analysis process by a sentence unit. If a candidate relation set is generated based on a conceptualized lexical clue, the TRD determines a core relation among the relations. If a final target relation is determined in the TRD and whole preparation for actual relation extraction is prepared, a SSREE(Semi-Supervised Relation Extractor)(220) and a SREE(Supervised Relation Extractor)(230) are performed.

    Abstract translation: 目的:提供使用基于tama的动词基础模式的批量书目信息的技术术语之间的关系的系统,以使用TAMA(技术协会采矿设备),其识别文本中包括的技术术语与技术术语之间的关系,从而 从科学技术领域的抽象和参考书目数据库中提取基于动词的模式中心关系。 构成:如果采用STM(Scientific Tech Mining)(190)的IIFP(综合信息与功能提供者)从数据库提取的句子,则TRD(目标关系确定器)(200)通过句子单位进行详细的分析处理。 如果基于概念化词汇线索生成候选关系集,则TRD确定关系之间的核心关系。 如果在TRD中确定最终目标关系,并准备实际关系提取的整个准备,则执行SSREE(半监督关系提取器)(220)和SREE(监督关系提取器)(230)。

    규칙기반의 전자문서 변환방법 및 그 시스템
    29.
    发明授权
    규칙기반의 전자문서 변환방법 및 그 시스템 失效
    基于映射规则及其系统转换电子文档的方法

    公开(公告)号:KR100762712B1

    公开(公告)日:2007-10-02

    申请号:KR1020050122613

    申请日:2005-12-13

    Abstract: 본 발명은 전자문서 내에 포함된 다양한 형태의 정보를 추출하고 데이터베이스화하는 과정에 규칙기반의 자동화 기법을 도입함으로써 과제관리 및 성과정보서비스에서 필요로 하는 방대한 양의 정보를 빠른시간 내에 정확하게 구축할 수 있는 규칙기반의 전자문서 변환방법 및 그 시스템을 제시한다.
    본 발명에 의하면, 입력대상 문서는 데몬 형태의 워드2HML 변환엔진을 통해 HML이라는 중간형태의 XML 문서로 변환되고, HML 문서에 매핑 규칙을 적용함으로써 다양한 형태(표, 리스트, 특정 문자열 등)의 정보를 추출해 낼 수 있다. 상기 추출된 정보는 데이터베이스 입력을 위해 메모리나 외부 파일에 XML 형식의 자료 모양을 갖추고 있어서 별도의 처리기를 거쳐 데이터베이스(DB)에 저장된다. 따라서, 이러한 일련의 자동화된 방법은 기존의 웹 기반의 수동 입력 인터페이스를 이용한 정보 구축의 단점을 보완하기 위한 대체 입력 방법으로서 가시적인 효과를 보여줄 수 있다.
    전자문서, 매핑규칙, 규칙문서, HML, XML, 정보추출

    규칙기반의 전자문서 변환방법 및 그 시스템
    30.
    发明公开
    규칙기반의 전자문서 변환방법 및 그 시스템 失效
    基于映射规则及其系统对电子文档进行变换的方法

    公开(公告)号:KR1020070062800A

    公开(公告)日:2007-06-18

    申请号:KR1020050122613

    申请日:2005-12-13

    CPC classification number: G06F17/227 G06F17/2247 G06F17/30917

    Abstract: A method and a system for transforming e-documents based on a rule are provided to precisely construct an enormous amount of information required for a project management/achievement information service in a short time by applying rule-based automation to a process in extracting various types of information from the e-documents and making the extracted information a database. A Word2HML transformer(100) transforms the inputted e-document(22) into an HML(Hypertext Markup Language) document(32). An HML2XML transformer(200) generates an XML document(36) available for a database(28) by analyzing/extracting the information after applying a mapping document(34) to the HML document. An XML2DB part(22) processes data of the XML document and stores the data to the database. The Word2HML comprises an HML transformer(110) for transforms the inputted e-document of an HWP or DOC type into the HML document by using a HWP or DOC transformation OCX(OLE(Object Linking and Embedding) control eXtension) library(120,130). The HML2XML comprises an XML processing engine(210), an HWP2XML main processor(220), a file processor(230), and a log processor(240).

    Abstract translation: 提供了一种基于规则转换电子文档的方法和系统,通过将基于规则的自动化应用于提取各种类型的过程来精确地构建项目管理/成就信息服务所需的大量信息 从电子文件中提取信息并将提取的信息提供给数据库。 Word2HML变换器(100)将输入的电子文档(22)转换成HML(超文本标记语言)文档(32)。 通过在将映射文档(34)应用于HML文档之后分析/提取信息,HML2XML变换器(200)生成可用于数据库(28)的XML文档(36)。 XML2DB部分(22)处理XML文档的数据并将数据存储到数据库。 Word2HML包括用于通过使用HWP或DOC变换OCX(OLE(对象链接和嵌入)控制扩展)库(120,130)将输入的HWP或DOC类型的电子文档转换成HML文档的HML变换器(110)。 HML2XML包括XML处理引擎(210),HWP2XML主处理器(220),文件处理器(230)和日志处理器(240)。

Patent Agency Ranking