Abstract:
본 발명은 확장 마크업 언어로 작성된 XML 문서의 계층적 구조를 손상시키지 않고 유지시키면서 단층적인 구조를 지니는 단편화된 XML 문서로 변환시켜주는 XML 문서를 위한 정보검색 시스템 및 그 방법과 그 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 것을 목적으로 한다. 상기 목적을 달성하기 위하여 본 발명은 본 발명은 확장 마크업 언어(XML)로 작성된 XML 원본문서를 위한 정보검색 방법에 있어서,(A) 상하구조로 형성된 복수의 계층들을 지니며 각각의 계층을 구성하는 복수의 노드들은 트리구조를 갖는 XML 원본문서가 복수의 변경노드들이 단층적인 트리구조를 형성하여 이루어진 XML 변경문서로 변환되는 단계, (B) 상기 (A) 단계에 의해 변환된 XML 변경문서가 저장되는 단계, (C) 상기 (B) 단계에 저장된 XML 변경문서에 기재된 정보 중에서 원하는 정보가 기재된 상기 변경노드가 검색되는 단계 및 (D) 상기 (C) 단계에 의하여 검색된 상기 변경노드가 상기 XML 원본문서가 지니는 계층적인 트리구조에 대응되어 출력되는 단계를 포함하여 구성된 것을 일 특징으로 한다. 상기와 같은 구성에 의해 본 발명은 XML 문서의 구조적 정보를 상실하지 않고 원문의 구조 정보를 유지하면서 XML 문서를 관리할 수 있도록 하며, 효과적인 질의처리를 돕고 빠른 구조검색이 가능토록 하고, 그 검색결과를 사용자에게 입체적 검색결과로 제공하는 효과를 지닌다. XML 원본문서, XML 변경문서, 계층, 단층, 트리구조, DTD, 단편화 알고리즘
Abstract:
차세대 대용량 저장장치의 동적 색인 관리 시스템 및 방법과 그 방법에 관한 소스 프로그램을 기록한 기록매체가 개시된다. 본 발명은 새로운 저장장치의 빠른 접근 속도 특성을 최대한 활용할 수 있는 분할 포스팅 구조를 기반으로 하여 In-Place 방식과 Merge-based 방식을 혼합한 형태의 동적 색인 구조로서, 보조 색인 저장기에 추가로 저장되는 문서의 색인 빈도수에 따라 포스팅 정보를 분할하고, 분할된 고빈도의 포스팅 정보를 주 색인 저장기로 이동시키며, 주 색인 저장기에 추가되는 문서의 포스팅 정보를 주기적으로 병합하는 색인 관리기, 및, 주 색인 저장기와 보조 색인 저장기에 저장된 포스팅 정보를 사용하여 정보의 검색 및 색인을 관리하는 정보 검색기를 포함하는, 동적 색인 관리 시스템을 제공하여, 검색 처리속도 및 색인정보 관리속도를 크게 향상시킬 수 있게 한다. SSD, 동적, 색인, 분할, 펄싱, 병합
Abstract:
PURPOSE: A framework for scientific knowledge discovery is provided to create an advanced scientific knowledge using a grid computing technology. CONSTITUTION: A globus toolkit(300) constitutes a grid environment and a database about a large capacity resources and integrally manages the computing resources. A SINDI(Scientific INtelligence DIscovery) core(200) automatically recognizes and classifies scientific technique document from the database, extracts a core technique, and reports interactions among the techniques. A SINDI workflow unit(500) creates a work flow in order to extract knowledge which a user wants to find using the database and the core techniques.
Abstract:
PURPOSE: A semi-automatic construction framework for a test collection is provided to reduce the load for constructing work and the deviation of the result by automating some standardized construction processes. CONSTITUTION: An automatic process unit(200) systematically processes a syntactic and a semantic characteristic of a document and creates triple. The triple is composed of specialized terms and relation candidate groups. A manual process unit(300) offers the triple to a constructor terminal and receives a triple which is selected by the constructor. A test collection builder(400) receives the selected triple, construct a test collection, and stores the test collection to a database unit(500).
Abstract:
PURPOSE: A dynamic index management system, method and recording medium the same are provided to improve index information management speed. CONSTITUTION: An index manager(30) divides posting information of a low frequency and a high frequency. The index manager periodically merges the posting information of a document added to a master main index storage unit(20). The master main index storing unit and the posting information saved in the secondary indexing storing unit(10) is used. An information search unit(40) enforces search and index management of a desired information.
Abstract:
PURPOSE: A system and a method for searching/managing database information are provided to construct a low-cost/high-efficiency information system by forming a stable management function in addition to a search function for a database. CONSTITUTION: An index database volume(70) stores an index database. A document database volume(80) stores distributed document databases. A dictionary database volume(50) stores distributed dictionary databases. A kernel(10) performs data I/O(Input/Output) between the index/document database volume and a user memory, and manages files, directories, records, and reverse files in the index/document database volume. A storage engine(20) manages catalogs storing metadata for the databases and manages document/indexes by using the kernel. A search engine(30) performs the search for a user's query. An indexer(40) extracts the index for the document inputted from the user by using the dictionary database. A data manager(60) generates the database by receiving a schema file from a manager, loads a bundle of raw documents in bulk, and performs indexing.
Abstract:
PURPOSE: A system and a method for managing information retrieval, and a recording medium recording a program source of the same are provided to economically retrieve information by reducing the unnecessary waste of resources and retrieve the information quickly without lowering system performance by efficiently distributing the resources even if lots of information retrievals are requested. CONSTITUTION: A user terminal(01) receives an information instruction such as an information retrieval instruction and a data management instruction. A work manager(02) outputs a work order instruction by distributing/ordering the work according to the information instruction inputted from the user terminal. The information retrieval tools(03) perform the information retrieval by receiving the work order signal. The databases(06) are connected to the information retrieval tools and store data.
Abstract:
규칙 추론기 및 이를 포함하는 와일드 패턴 규칙의 동적인 구체화 방법이 개시된다. 본 발명은 입력된 추론 규칙에 와일드 패턴 포함 유무에 따라 온톨로지 스키마(Ontology schema)를 참조하여 리티 네트워크를 구축하는 리티 네트워크 구축부, 구축된 리티 네트워크에 온톨로지(Ontology)를 입력하여 실행함으로써 추론된 트리플을 생성하고 와일드 패턴이 동적으로 구체화된 새로운 규칙을 생성하는 리티 네트워크 실행부 및 생성된 새로운 규칙을 리티 네트워크에 추가하여 리티 네트워크를 확장하는 리티 네트워크 확장부를 포함하여, 리티 네트워크에서 불필요한 패턴 매칭을 제거하여 규칙 기반의 추론 성능을 개선할 수 있다. 추론 규칙, 와일드 패턴, 와일드 패턴 규칙, 구체화, 리티 네트워크, 규칙 기반, 추론
Abstract:
본 발명은 기술용어 간 관계 추출용 테스트 컬렉션 반자동 구축을 위한 시스템에 관한 것으로서, 문헌에 존재하는 기술용어와 이들 간의 연관관계를 언어 자원을 기반으로 시스템적으로 처리하여, 제한된 문헌과 개체들을 기반으로 소규모의 테스트 컬렉션을 구축하는 기존의 접근법에서 벗어나 대규모의 학술 데이터 베이스와 다양한 분야의 전문용어 사전, 그리고 최신의 기계학습 알고리즘을 활용하여 실용적인 테스트 컬렉션을 구축하는 기술용어 간 관계 추출용 테스트 컬렉션 반자동 구축을 위한 시스템을 제공하여, 정형화되고 시간이 많이 소요되는 작업을 자동화시킴으로써, 구축자의 노력을 최소화할 수 있고, 구축자의 성향에 따라 발생하는 결과의 편차를 줄일 수 있는 효과가 있다 테스트 컬렉션, 트리플, 연관관계
Abstract:
본 발명은 그리드 컴퓨팅 기반 과학기술 지식발견 프레임 워크에 관한 것으로서, 그리드 서비스를 정의하고 최종 사용자가 직접적으로 활용할 수 있는 보다 고차원적인 분산 그리드 서비스를 제공하여, 각 단위 엔진에 가장 적합한 리소스를 할당함으로써 전체 성능을 크게 개선시킬 수 있으며, 단위 엔진 별로 요구되는 컴퓨팅 파워나 메모리 공간을 최적화된 상태로 지원함으로써 실행과정 중의 어느 한 부분이 비효율적으로 지연되는 것을 방지할 수 있는 효과가 있다. 그리드, 리소스, 컴퓨팅, 프레임워크, 알고리즘