Abstract:
PURPOSE: A semantic syntactic tree kernel based processing system and method thereof are provided to automatically extract an associative relationship by calculating similarity of two sentences by a semantic syntactic tree. CONSTITUTION: A language analysis unit(110) analyzes CRF(conditional random field) information. A integration quality processing unit(120) receives an analysis result. A similarity extracting unit(130) calculates similarity by calculating a semantic parse tree kernel by the relation of syntax. A similarity extracting unit(130) calculates similarity and semantic syntactic tree kernel.
Abstract:
본 발명은 대용량 데이터베이스의 의미기반 기술용어 발굴 방법에 관한 것으로, 특히, 에이알엠수단, 티알에스수단, 분석수단, 추적수단, 관리 데이터베이스, 과학정보 데이터베이스, 에이알이에스 수단, 이알에이 수단, 지식 데이터베이스를 포함하는 장치에 의하여 대용량 데이터베이스의 의미기반 기술용어를 발굴하는 방법에 있어서, 분석수단에 의하여 과학정보 데이터베이스의 운용부하가 소정 비율로 낮은 경우 에이알엠 수단이 관리 데이터베이스로부터 검색한 질의어를 추출하여 티알에스 수단에 제공하고 티알에스 수단은 질의어에 의하여 과학 데이터베이스로부터 지정된 기술의 문서집합과 해당 포스팅 정보를 추출하여 분석수단에 제공하는 과정; 분석수단은 타스 수단에 의하여 문서집합으로부터 신규와 시드의 기술용어가 검출되면 에이알이에스 수단에 통보하고 지식 데이터베이스에 등록하는 기술용어 과정; 분석수단은 타마 수단에 의하여 문서집합으로부터 신규와 시드의 문맥정보가 검출되면 에이알이에스 수단에 통보하고 지식 데이터베이스에 등록하는 문맥정보 과정; 문서집합과 지식 데이터베이스의 정보를 추적수단에 제공하여 연관된 기술을 추적하고, 추적된 정보를 지식 데이터베이스와 디알에스 수단에 제공하며, 추적된 정보를 분석하여 문서로 출력하는 과정; 을 포함하는 구성을 특징으로 하여, 대용량 데이터베이스의 전체 검색 효율성과 활용성을 높이고, 검색된 기술용어들의 관계를 분석 및 축적하여 기술정보들의 연관 관계, 시계열 분석, 분류 등을 실시간으로 신속하게 검색 및 추적하여 기술검토, 개발 및 의사결정을 신속하게 하는 효과 가 있다. 특허, 논문, 데이터베이스, 검색, 질의어, 기술용어, 문맥정보, 추출
Abstract:
A system and a method for analyzing morphemes of Hangul for automatic indexing are provided to index a large size of data automatically and efficiently to maximize a word analysis speed, and modularize and structure a morpheme analyzer. A dictionary manager(100) manages an analysis dictionary by managing a dictionary database. A morpheme analyzer(200) performs a morpheme analysis by receiving an analysis dictionary management result, and modularizing more than one of uninflected word, inflected word, numeric word, non-registration, independent word, and morpheme analyses. An index provider(300) provides an index by receiving a morpheme analysis result from the morpheme analyzer. The dictionary manager manages more than one of a part-of-speech dictionary, a functionality dictionary, and a form morpheme dictionary as the analysis database. The morpheme analyzer includes an uninflected word analyzing module(210), an inflected word analyzing module(220), a numeric word analyzing module(230), a non-registration analyzing module(240), an independent word analyzing module(250), and a type morpheme analyzing module(260).
Abstract:
PURPOSE: A deep knowledge providing method based on a scientific knowledge memory and a device thereof are provided to analyze literature of a specific science field and copy a complex process which learns knowledge by using natural language processing and mining technology, thereby automatically extracting and accumulating specialized knowledge. CONSTITUTION: A knowledge memory(304) stores relational knowledge, structural knowledge, and procedural knowledge for a document. A deep knowledge providing unit(306) inputs a query language. The deep knowledge providing unit searches and provides a triple which includes the query language and documents related to the triple. The deep knowledge providing unit uses a GCL(Generalized Concordance Lists) query which searches a specific word or a relation between word sets or between words. [Reference numerals] (302) Multidimensional knowledge generating technology; (304a) Relational knowledge memory; (304b) Structural knowledge memory; (304c) Procedural knowledge memory; (306) Deep knowledge providing technology; (AA) Large scholarly information; (BB) Deep knowledge delivery by field
Abstract:
PAS(Predicate-Argument Structure, 술어-논항 구조) 기반의 어휘적 패턴을 이용한 관계 추출 방법 및 장치가 제공된다. 본 발명에 따른 개체간 관계 예측 방법은 문장의 predicate-argument(술어-논항) 관계를 분석하여 문장 내에 존재하는 두 개체 간의 유의미한 관계를 표현하는 PAS 패턴을 얻는 과정; 상기 추출된 predicate-argument 패턴을 참조하여 predicate 단어와 argument 단어, predicate의 종류, 그리고 predicate와 argument 사이의 관계 레이블을 이용하여 자질벡터를 생성하는 과정; 상기 자질벡터를 기계학습기에 입력하여 개체간의 의미적 연관관계를 식별하는 과정을 포함하는 것을 특징으로 한다. 본 발명에 따른 관계 식별 방법 및 장치는 문장의 의미가 핵심 역할을 수행하는 정보추출, 자동요약, 질의응답과 같은 고수준 자연어 처리 애플리케이션에서 PAS 패턴은 유용하게 사용될 수 있다.
Abstract:
전문 용어의 개념을 부연하여 기술하는 기술 문헌으로부터 전문 용어 및 그에 상응하는 기술적 개념을 검출하는 방법 및 그에 적합한 장치가 개시된다. 언어 표현 탐지 장치는 전문 용어에 대한 정의문 및 기술 문헌 내에서 표현된 상기 전문 용어에 대한 부연 서술을 참조하여 전문 용어의 의미 표현 및 부연서술의 의미 표현을 각각 추출하는 언어적 의미 표상 추출부; 상기 전문 용어의 의미 표현과 상기 부연서술의 의미표현들에 대한 함의관계를 판별하는 함의관계 판별부; 및 판별된 함의 관계에 기반하여 상기 기술 문헌으로부터 상기 전문 용어에 대하여 이미 존재하는 기술적 개념을 추출하고 이를 기반으로 새로운 기술적 개념(Newly Emerged Technological Concept) 혹은 새로운 전문 용어를 발견하는 신규 언어 표현 탐지부를 포함한다.
Abstract:
PURPOSE: A method for generating a distribution rule and a query analyzing device therefor are provided to generate the distribution rule for reducing a response speed of the whole system by minimizing the join calculation and a network input/output time between nodes of a distributed parallel system. CONSTITUTION: A pattern extracting/grouping unit(140) extracts a pattern from query sets included in a query list and groups the pattern based on type information in order to generate a type pattern group of a query unit. A grouping unit(150) generates a type pattern group of a service unit based on the type information. A distribution rule generating unit(160) generates a distribution rule by generating a pattern set composition file of the query unit with the type pattern group of the service unit. [Reference numerals] (100) Query analyzing device; (110) Query list DB; (120) Distribution rule DB; (130) Query list extracting unit; (140) Pattern extracting/grouping unit; (150) Grouping unit; (160) Distribution rule generating unit
Abstract:
PURPOSE: A predicate-argument structure(PAS) based relation recognition method and an apparatus using the same are provided to determine relations between meanings of words using a PAS as a quality vector. CONSTITUTION: A parser(104) acquires a predicate-argument relation graph by analyzing predicate-argument relations of a sentence. A PAS(Predicate-Argument Structure) pattern extractor(106) extracts a PAS pattern by only extracting a PAS which expresses a meaningful relation between two parts of a sentence. A quality vector generator(108) creates a quality vector using the predicate-argument relation.
Abstract:
동사기반패턴을 이용한 대용량 문헌정보 내에서의 기술용어간 관계추출 시스템이 개시된다. 본 발명은 과학기술분야 학술문헌 데이터베이스를 대상으로 텍스트에 포함된 기술용어와 그들 간의 연관관계를 인식할 수 있는 타마 수단을 이용하여 과학기술 전 분야에 걸쳐 있는 초록 및 서지 데이터베이스로부터 동사기반 패턴 중심의 관계추출을 할 수 있는 장치로서, 대규모의 학술 데이터베이스를 활용한 실용적인 관계추출 시스템 구조를 제공하는 효과가 있다. STM, 타마, TAMA, 데이터베이스, 연관관계, 티알디, 아트