Abstract:
본 발명은 문헌에서 용어에 대한 서술적 개념 표현을 추출하기 위한 장치 및 그 동작 방법을 개시한다. 즉, 문장을 구성하는 단어 간의 문법적 관계를 기초로 상기 문장에 포함된 하나 이상의 단어를 술어(Predicate)로서 지정하며, 상기 술어로 지정된 각각의 단어와 관계되는 하나 이상의 단어를 논항(Argument)으로 지정하여 상기 문장에 대응하는 술어-논항 튜플(Predicate Argument Tuple)을 추출하는 변환처리부; 상기 변환처리부로부터 추출되어 전달되는 순어-논항 튜플을 각각의 문장에 대응하여 저장하는 정보저장부; 및 질의어에 해당하는 문장으로부터 추출되는 하나 이상의 술어-논항 튜플을 상기 변환처리부로부터 수신하고, 상기 수신된 각각의 술어-논항 튜플 중 적어도 하나를 포함하는 문장을 상기 정보저장부로부터 추출하는 정보검색부를 포함함으로써, 단편적으로 진행되었던 문헌에 대한 개념적 접근이 실질적으로 가능하도록 하며, 사용자 측면에서 자신이 원하는 용어 개념이 포함된 보다 광범위한 정보 접근이 가능하다.
Abstract:
과학기술핵심개체 간 의미적 연관관계 자동 추출을 위한 시맨틱 구문 트리 커널 기반 처리 시스템 및 방법이 개시된다. 본 발명은 입력된 문장에 대한 구문, 품사 정보 및 기저구 정보를 분석하고, 분석한 구문, 품사 정보 및 기저구 정보를 바탕으로 가지치기를 수행하여 입력된 문장의 구문의 관계를 추출하고, 추출한 문장의 구문의 관계에 의해 입력된 문장의 구문의 구문적 유사도, 어휘 의미적 유사도 및 시맨틱 구문 트리 커널을 계산하여 입력된 문장의 구문의 유사도를 추출함으로써, 두 문장의 유사도를 정확하게 계산할 수 있다.
Abstract:
본 발명은 패스웨이 구축 시스템 및 방법에 관한 것으로, 단백질, 질병, 합성물, 징후, 효소, 의약폼, 질병, 장소, 패스웨이 중 적어도 하나에 대한 개체명이 저장된 사전 정보 데이터베이스, 상기 사전 정보 데이터베이스를 이용하여 입력 문서에서 개체들을 인식하는 개체 인식부, 기 저장된 문맥 패턴 정보를 근거로 상기 인식된 개체 사이의 문맥을 추출하고, 상기 추출된 문맥을 정규화하는 방식으로 개체간의 관계를 인식하는 관계 인식부, 상기 인식된 개체들을 대상으로 웹 검색을 수행하여, 상기 개체들이 출현하는 문서 및 각 개체들의 세포 내 장소 정보를 수집하고, 상기 수집된 정보에 의한 관계 이벤트를 생성하는 관계 이벤트 생성부, 상기 인식된 관계 이벤트를 근거로 세포내 해당 장소에 해당 개체들을 표시하여 패스웨이를 생성하는 패스웨이 생성부를 포함한다.
Abstract:
본 발명은 패러프레이즈 식별 기반 문장 유사도 판단 장치 및 그 동작 방법을 개시한다. 즉, 문장을 구성하는 단어 간의 문법적 관계를 기초로, 상기 문장의 각 구절에 포함된 2 이상의 단어에 대한 상관 관계 지정을 통해 제1문장 및 제2문장 각각에 대응하는 술어-논항 튜플(Predicate Argument Tuple)을 추출하는 구문분석단계; 상기 제1문장으로부터 추출된 하나 이상의 술어-논항 튜플과 상기 제2문장으로부터 추출된 하나 이상의 술어-논항 튜플 간의 유사도를 측정하는 유사도측정단계; 및 상기 측정된 술어-논항 튜플 간의 유사도를 기초로 상기 제1문장 및 상기 제2문장 간의 유사도를 측정하기 위한 근사 정렬을 수행하는 근사정렬수행단계를 포함함으로써, 패러프레이즈 식별 문제를 지도 학습(supervised learning) 기반의 자동 분류 모델로 접근할 수 있다.
Abstract:
본 발명은 기술용어 간 관계 추출용 테스트 컬렉션 반자동 구축을 위한 프레임워크에 관한 것으로서, 문헌에 존재하는 기술용어와 이들 간의 연관관계를 언어 자원을 기반으로 시스템적으로 처리하여, 제한된 문헌과 개체들을 기반으로 소규모의 테스트 컬렉션을 구축하는 기존의 접근법에서 벗어나 대규모의 학술 데이터 베이스와 다양한 분야의 전문용어 사전, 그리고 최신의 기계학습 알고리즘을 활용하여 실용적인 테스트 컬렉션을 구축하는 기술용어 간 관계 추출용 테스트 컬렉션 반자동 구축을 위한 프레임워크를 제공하여, 정형화되고 시간이 많이 소요되는 작업을 자동화시킴으로써, 구축자의 노력을 최소화할 수 있고, 구축자의 성향에 따라 발생하는 결과의 편차를 줄일 수 있는 효과가 있다.
Abstract:
PURPOSE: A graph data-based instance route search system and a method thereof are provided to efficiently search for correlations by applying instance information and relation information between classes to a parallel graph database. CONSTITUTION: A peer server information database(160) stores information about a class route managed by peer servers. A graph database(110) stores class information about keywords and relation information. If two or more keywords are inputted by a user, a master server(100) extracts a class about the keywords from the graph database and confirms the peer servers from the peer server information database in order to transmit a route search command including the class to the peer servers. [Reference numerals] (100) Master server; (110) Graph DB; (120) Communication unit; (130) User interface unit; (140) Class route generating unit; (150) Route search request processing unit; (160) Peer server information DB
Abstract:
PURPOSE: A data distribution system and a method thereof are provided to minimize network IO time and join operations between nodes in a distribution parallel system, thereby shortening response time of the whole system. CONSTITUTION: Data nodes(200a-200c) store data. A management node(100) confirms a type pattern by analyzing the data. The management node determines a data node which stores the data based on state information of data nodes which the type pattern is set and distributes the data to the data node. When the data includes a plurality of type patterns, the management node is assigned to one data node. [Reference numerals] (100) Management node; (200a) Data node 1; (200b) Data node 2; (200c) Data node n; (AA) Data
Abstract:
PURPOSE: A framework for scientific knowledge discovery is provided to create an advanced scientific knowledge using a grid computing technology. CONSTITUTION: A globus toolkit(300) constitutes a grid environment and a database about a large capacity resources and integrally manages the computing resources. A SINDI(Scientific INtelligence DIscovery) core(200) automatically recognizes and classifies scientific technique document from the database, extracts a core technique, and reports interactions among the techniques. A SINDI workflow unit(500) creates a work flow in order to extract knowledge which a user wants to find using the database and the core techniques.
Abstract:
PURPOSE: A semi-automatic construction framework for a test collection is provided to reduce the load for constructing work and the deviation of the result by automating some standardized construction processes. CONSTITUTION: An automatic process unit(200) systematically processes a syntactic and a semantic characteristic of a document and creates triple. The triple is composed of specialized terms and relation candidate groups. A manual process unit(300) offers the triple to a constructor terminal and receives a triple which is selected by the constructor. A test collection builder(400) receives the selected triple, construct a test collection, and stores the test collection to a database unit(500).
Abstract:
PURPOSE: A method for extracting a semantic associative relation of context based on syntax analysis of whole document, a device thereof and a recording medium storing a program source are provided to extract the semantic associative relation of context based on syntax analysis of whole document, thereby enabling to connect to UPK(Undiscovered Public Knowledge). CONSTITUTION: A TRS(Tech Retrieval System)(110) manages whole data which recognition of the technical terms are completed and provides searching service in different modules. A TAS(Tech Acquisition System)(150) searches the technical terms based on a dictionary from data of the TRS and extracts new terms. A TLA(Tech Language Analyzer)(180) does chunking and tagging the source document to conveniently extract the relation between technical terms recognition and relation. A TAMA(Tech Association Mining Appliance)(170) analyzes the document by construction through the TLA and extracts a semantic associative relation of context and performs conceptualizing based on word net. A SATT(Semi-Automatic Tech-Tracking Engine)(160) has semantic associative relation and provides many services.