Abstract:
A device and a method for allocating subjects or fields in an information search system are provided to search information by allocating the subjects or the fields automatically based on taxonomy, or based on tags or folksonomy when a thesaurus is not constructed. A search engine(41) searches information from documents based on an index corresponding to a query or the document, and a database(42) stores and manages the information searched by the search engine. A thesaurus matcher(43) allocates a subject or a field to the document by extracting the index from original document stored in the database and performing thesaurus matching based on the index. A taxonomy processor(44) allocates the subject based on terminology by extracting the terminology from a definition sentence stored in the database and allocates the field by using taxonomy. A tag processor(45) extracts a tag from a web document having the tag among the documents stored in the database and allocates the subject by using the extracted tag. A folksonomy processor(46) extracts the tag from the web document, allocates the subject by using the extracted tag, and allocates the field by using the folksonomy.
Abstract:
기간별로 분류된 말뭉치로부터 용어의 사용추이 정보를 분석하고 용어의 사용추이 정보를 기초로 하여 용어의 생명주기를 판단하여 용어의 생명주기를 관리할 수 있는 용어 추출시스템과 용어 생명주기 관리 시스템 및 용어 생명주기 관리방법과 그 방법에 대한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체. 본 발명에 의한 용어 추출시스템은 기간별로 분류된 말뭉치가 입력되는 말뭉치 입력수단; 상기 말뭉치 입력수단으로부터 단일어와 복합어를 포함하는 용어를 추출하는 용어 추출수단; 상기 용어추출수단으로부터 추출된 용어의 사용추이 정보를 산출하는 분석수단; 및 상기 용어추출수단에 의해 추출된 용어가 저장되는 용어 테이블과 상기 분석수단에 의해 분석된 용어 사용추이 정보가 저장된 용어 사용추이 정보 테이블을 포함하는 데이터베이스;를 포함한다. 용어 추출, 생명주기, 사용추이, 용어지배, 말뭉치
Abstract:
A system and a method for providing a research information service based on the semantic web are provided to enable a user to efficiently check all information needed for selecting an optimal coordinates researcher and fixing a correct R&D(Research and Development) policy as well as research trend by constructing an R&D support service platform based on the semantic web. A knowledge processor(100) processes and provides a knowledge information sharing service by processing knowledge based on a URI(Uniform Resource Identifier) and a DBMS(DataBase Management System). An information circulation service unit(200) receives a result from the knowledge processor, and provides registration/search/statistics services of research information based on the semantic web. An inference service unit(300) receives the result from the information circulation service unit, and explores/provides indirect information through fact, rule, and post process. A common service unit includes a URI registration/management service unit registering/managing/searching the URI of manpower, institutions, reports, papers, patents, themes, and categories, and a theme and category classification service unit performing thesaurus base automatic classification.
Abstract:
본 발명은 다중 분류체계를 이용한 통제어 및 분야명 자동 할당 시스템 및 그 방법을 제공하기 위한 것으로, 다중 분류체계를 반입, 반출, 등록, 편집, 관리하는 다중 분류체계 관리부와; 상기 다중 분류체계 관리부에서 다중 분류체계를 제공받아 각 분류체계와 매핑된 통제어를 관리하는 통제어 관리부와; 상기 통제어 관리부에서 통제어를 제공받아 문서로부터 추출된 색인어와 통제어를 매칭하는 용어 매칭부와; 상기 용어 매칭부에서 매칭 결과를 제공받아 상위 통제어 및 각 분류체계 별 상위 분야명을 제시하는 통제어 및 분야명 할당부;를 포함하여 구성함으로서, 다중 분류체계 기반으로 문서를 분류할 필요가 있는 전 분야에 걸쳐 안정적이고 점진적인 성능 향상을 보일 수 있는 통제어 및 분야명 자동 할당을 가능하게 한다. 자동 할당, 통제어 할당, 분야명 할당, 분류체계, 문서 분류
Abstract:
A system and a method for assigning controlled terms and categories by using a multi-classification system are provided to enable a classification service provider to use a desired classification system by extracting core concepts from a document with the controlled terms, matching the core concepts with a multi-classification system, and assigning a plurality of categories to one document. A multi-classification system manager(10) receives, outputs, edits, and manages a multi-classification system, and a controlled term manager(20) manages controlled terms mapped to each classification system by receiving the multi-classification system from the multi-classification system manager. A term matcher(30) matches the controlled term with an index extracted from the document by receiving the controlled terms from the controlled term manager. A controlled term/category assigner(40) presents an upper controlled term and an upper category of each classification system by receiving a matching result from the term matcher. The multi-classification system manager registers or receives the multi-classification system, edits the multi-classification system without colliding an ID of each multi-classification system, provides the multi-classification system in real-time, and manages output of the multi-classification system.
Abstract:
본 발명은 정보 검색 시스템에서의 주제 또는 분야 할당 장치 및 그 방법을 제공하기 위한 것으로, 인터넷을 통해 사용자 단말, 웹 포털 사이트, 웹 사이트와 연결되어 정보를 검색하고 검색된 정보를 제공하는 정보 검색 서버에 있어서, 상기 정보 검색 서버는, 질의어 또는 문서에 대응하는 색인어를 기반으로 문서에 대하여 정보 검색을 수행하는 검색 엔진과; 상기 검색 엔진에서 검색된 정보를 저장하고 관리하는 데이터베이스와; 상기 데이터베이스에 저장된 원문으로부터 색인어를 추출하여 색인어에 의한 시소러스 매칭을 수행하여 원문에 대한 주제 또는 분야 할당을 수행하는 시소러스 매칭부와; 상기 데이터베이스에 저장된 정의문으로부터 용어를 추출하여 추출한 용어에 의해 주제를 할당하고 택소노미를 사용하여 분야를 할당하는 택소노미 처리부;를 포함하여 구성함으로서, 시소러스가 미구축된 경우 택소노미를 이용하여 주제 또는 분야를 자동으로 할당하거나 태그 또는 폭소노미를 이용하여 주제 또는 분야를 자동으로 할당하여 정보 검색을 수행할 수 있게 되는 것이다. 정보 검색 시스템, 주제 또는 분야 할당, 시소러스(Thesaurus), 택소노미(Taxonomy), 폭소노미(Folksnomy)
Abstract:
본 발명은 시맨틱 웹 기반 연구정보 서비스 시스템 및 그 방법을 제공하기 위한 것으로, URI 기반과 DBMS 기반 하에 지식 처리를 수행하여 지식정보 공유 서비스가 제공될 수 있도록 처리하는 지식 처리부와; 상기 지식 처리부에서 처리된 결과를 제공받고, 시맨틱 웹에 기반하여 연구정보의 등록과 검색 처리 및 통계 서비스를 제공하는 정보 유통 서비스부와; 상기 지식 처리부에서 처리된 결과를 제공받고, 팩트, 규칙 및 후처리를 통해 연구개발 정보에서 명시적으로 드러나 있지 않은 간접적인 정보를 발굴하여 제공하는 추론 서비스부;를 포함하여 구성함으로서, 차세대 지능형 웹으로 컴퓨터가 정보의 의미를 이해하고 정보들 간의 논리적 추론까지 할 수 있는 시맨틱 웹 기술을 활용하여 연구 개발 전주기 지원서비스 플랫폼을 구축하여 연구기획에 필요한 연구동향은 물론이고 최적의 협력 연구자 선정, 지역별/연구분야별 특색에 맞는 정확한 정책수립 등에 필요한 모든 정보를 효율적으로 파악할 수 있게 되는 것이다. 시맨틱 웹, 연구정보 서비스, 시소러스, 주제 분야 할당, 연구자 네트워크, 연구자 정보, 연구성과 맵, URI
Abstract:
A document database forming method and an information retrieval method using thesaurus matching are provided to easily form a document database by automatically forming the document database with a program, and quickly update the document database in case that a new field and term is generated, as formation of the document database is automatically changed by update of a field classification system and a thesaurus. A document is read and contents of the document are extracted(S120). An index word of the document is extracted by performing morpheme analysis for the extracted document(S140). The index word is analyzed through the thesaurus by matching with the thesaurus(S150). An analysis result is stored to the document database(S160). Thesaurus matching is analyzed by comparing more than one condition selected from a term frequency, a document frequency, a field classification frequency, and a concept word depth of the index word.
Abstract:
A system and a method for distribution information based on ontology are provided to offer high quality information, and track a document written by the user, and manage history of the document by converting meta information written from a user into the ontology and using the ontology. A format verifying module(302) checks whether the document includes virus or worm, and an extension of the document is correct or not in case that a document registration request signal for managing/distributing the information is received from a user computer. An ontology repository(306) converts the meta information received from the user computer into the ontology, and stores the information for the document with the information including URI(Uniform Resource Identifier), structure, concept, and additional information for the document. A program storing part(316) includes an ontology storing/managing program for converting the meta information into the ontology after the meta information is verified by linking with the ontology and assigning an ID to each ontology information by combining the IDs.