Abstract:
대용어 참조해소 시스템 및 대용어 참조해소 방법이 개시된다. 본 발명은 문서 내에서 대용의 기능을 담당하는 어휘인 대용어를 찾아내고, 문서 내에서 해당 대용어가 어떤 핵심개체를 가리키는지를 구별하는 참조해소 과정을 통해 과학기술문헌의 핵심개체인식의 재현율을 높이는 효과가 있다. 선행어, 대명사, 대용어, 대용대명사, 참조해소
Abstract:
A Korean morphology analysis system and a method thereof using a morpheme analysis unit supplying a morpheme analysis result and a database including a base analysis pre-stored domain are provided to perform one analysis of an exclamation analysis, an uninflected word analysis, a numerals analysis and not-registered word analysis. A dictionary management unit(114) manages database(116) including a pre-analyzed dictionary storage area. In case the morphological analysis-requested word is inputted, a morphological analyzing unit receives pre-analyzed dictionary search result corresponding to the morphological analysis request from a pre-control unit. The morpheme analysis unit provides the morpheme analysis result based on the analysis search result.
Abstract:
A method for constructing a knowledge base and a server thereof are provided to construct an intuitive knowledge base based on both present knowledge and target levels of a user. A server constructing a knowledge base defines schema items(S300). When resource information including one of a file, the degree of difficulty and an arrival object is inputted, the server constructing a knowledge base generates an intrinsic identifier for the resource information. By analyzing the inputted resource information, the server constructing a knowledge base extracts attribute information(S302,S304). The server sets up the correlation of each extracted attribute information according to the defined schema items(S306).
Abstract:
본 발명은 데이터베이스(DB)와 정보검색(IR) 통합을 위한 문서단위 동적 색인관리 특성을 갖는 정보검색 시스템 및 그 방법에 관한 것으로, 온라인으로 삽입, 삭제, 변경되는 문서의 포스팅 정보를 트랜잭션 방식으로 저장하는 보조색인저장기와; 상기 보조색인저장기에 저장된 포스팅 정보 중에서 미리 정해진 임계치 크기에 도달한 포스팅 정보를 주색인저장기로 이동시키는 색인펄싱(pulsing)장치; 및 상기 주색인저장기와 상기 보조색인저장기에 저장된 포스팅 정보를 사용하여 온라인으로 삽입, 변경, 삭제된 문서를 포함하여 원하는 정보를 검색하는 정보검색기;를 포함하여 구성함으로써, 데이터베이스(DB)와 정보검색(IR) 통합하여 문서단위 동적 색인관리를 할 수 있다. 데이터베이스(DB), 정보검색(IR), 통합, 문서, 동적, 색인관리, 포스팅정보
Abstract:
본 발명은 확장 마크업 언어로 작성된 XML 문서의 계층적 구조를 손상시키지 않고 유지시키면서 단층적인 구조를 지니는 단편화된 XML 문서로 변환시켜주는 XML 문서를 위한 정보검색 시스템 및 그 방법과 그 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 것을 목적으로 한다. 상기 목적을 달성하기 위하여 본 발명은 본 발명은 확장 마크업 언어(XML)로 작성된 XML 원본문서를 위한 정보검색 방법에 있어서,(A) 상하구조로 형성된 복수의 계층들을 지니며 각각의 계층을 구성하는 복수의 노드들은 트리구조를 갖는 XML 원본문서가 복수의 변경노드들이 단층적인 트리구조를 형성하여 이루어진 XML 변경문서로 변환되는 단계, (B) 상기 (A) 단계에 의해 변환된 XML 변경문서가 저장되는 단계, (C) 상기 (B) 단계에 저장된 XML 변경문서에 기재된 정보 중에서 원하는 정보가 기재된 상기 변경노드가 검색되는 단계 및 (D) 상기 (C) 단계에 의하여 검색된 상기 변경노드가 상기 XML 원본문서가 지니는 계층적인 트리구조에 대응되어 출력되는 단계를 포함하여 구성된 것을 일 특징으로 한다. 상기와 같은 구성에 의해 본 발명은 XML 문서의 구조적 정보를 상실하지 않고 원문의 구조 정보를 유지하면서 XML 문서를 관리할 수 있도록 하며, 효과적인 질의처리를 돕고 빠른 구조검색이 가능토록 하고, 그 검색결과를 사용자에게 입체적 검색결과로 제공하는 효과를 지닌다. XML 원본문서, XML 변경문서, 계층, 단층, 트리구조, DTD, 단편화 알고리즘
Abstract:
본 발명은 다양한 바이오패스웨이 관련 기관에서 다양한 바이오패스웨이 기술 언어(KGML, SBML, BIOPAX 등)를 사용하여 바이오패스웨이를 개별적 독립적으로 구축하기 때문에 이질적인 언어로 표현된 바이오패스웨이를 효과적으로 통합하기 위함이다. 이를 위해 본 발명은, 바이오패스웨이 입력을 받는 단계(S90), 바이오 패스웨이를 제1언어로 변환하는 단계(S91), 바이오패스웨이를 분리하는 단계(S92), 바이오패스웨이의 노드 또는 관계를 표준용어로 표준화하고 노드 또는 관계 형태로 바이오패스웨이를 저장하고, 노드 또는 관계와 관련된 속성정보를 추출하는 단계(S93), 바이오패스웨이를 검색하는 단계(S94), 복수의 바이오패스웨이들을 통합하는 단계(S95)를 포함한다.
Abstract:
PURPOSE: A scheme matching device and a method thereof are provided to accurately determine a response relation between terminal nodes in a scheme by measuring similarity through location and matching relations between nodes. CONSTITUTION: A scheme parser(110) generates a hierarchical structure by parsing a target scheme. A language similarity measuring unit(120) measures a language similarity value between terminal nodes in the hierarchical structure. A terminal node matching unit(130) selects a matched terminal node and determines a response relation of the terminal nodes by using the language similarity value. If two or more terminal nodes are selected, a structure similarity measuring unit(140) obtains a neighboring node similarity value and a path similarity value of the terminal nodes. The terminal node matching unit selects a matching terminal node having the biggest similarity value and determines the response relation. [Reference numerals] (100) Scheme matching device; (110) Scheme parser; (120) Language similarity measuring unit; (130) Terminal node matching unit; (140) Structure similarity measuring unit; (160) Matching node information DB
Abstract:
PURPOSE: A framework for scientific knowledge discovery is provided to create an advanced scientific knowledge using a grid computing technology. CONSTITUTION: A globus toolkit(300) constitutes a grid environment and a database about a large capacity resources and integrally manages the computing resources. A SINDI(Scientific INtelligence DIscovery) core(200) automatically recognizes and classifies scientific technique document from the database, extracts a core technique, and reports interactions among the techniques. A SINDI workflow unit(500) creates a work flow in order to extract knowledge which a user wants to find using the database and the core techniques.
Abstract:
PURPOSE: A semi-automatic construction framework for a test collection is provided to reduce the load for constructing work and the deviation of the result by automating some standardized construction processes. CONSTITUTION: An automatic process unit(200) systematically processes a syntactic and a semantic characteristic of a document and creates triple. The triple is composed of specialized terms and relation candidate groups. A manual process unit(300) offers the triple to a constructor terminal and receives a triple which is selected by the constructor. A test collection builder(400) receives the selected triple, construct a test collection, and stores the test collection to a database unit(500).
Abstract:
PURPOSE: A method for extracting a semantic associative relation of context based on syntax analysis of whole document, a device thereof and a recording medium storing a program source are provided to extract the semantic associative relation of context based on syntax analysis of whole document, thereby enabling to connect to UPK(Undiscovered Public Knowledge). CONSTITUTION: A TRS(Tech Retrieval System)(110) manages whole data which recognition of the technical terms are completed and provides searching service in different modules. A TAS(Tech Acquisition System)(150) searches the technical terms based on a dictionary from data of the TRS and extracts new terms. A TLA(Tech Language Analyzer)(180) does chunking and tagging the source document to conveniently extract the relation between technical terms recognition and relation. A TAMA(Tech Association Mining Appliance)(170) analyzes the document by construction through the TLA and extracts a semantic associative relation of context and performs conceptualizing based on word net. A SATT(Semi-Automatic Tech-Tracking Engine)(160) has semantic associative relation and provides many services.