Abstract:
PURPOSE: An extracting device for a semantic technological term of a high-capacity database is provided to rapidly perform technical examination, examination, and decision by searching/tracing the associative relations of the technological information, time series analysis, and classification in a real time. CONSTITUTION: An ARM(Acquisition Rule Manager) unit extracts a query language. The extracted query language is provided as a TRS(Tech Retrieval System) unit(S110). The TRS unit provides the document group of the designated technology and posting information to an analysis unit(S120). The analysis unit registers the new and seed technological term to the knowledge database(S130,S140). The document group and the information of the knowledge database is provided to a tracking unit and the related technology is traced. The traced information is outputted with a document.
Abstract:
PURPOSE: A system and a method for searching/managing database information are provided to construct a low-cost/high-efficiency information system by forming a stable management function in addition to a search function for a database. CONSTITUTION: An index database volume(70) stores an index database. A document database volume(80) stores distributed document databases. A dictionary database volume(50) stores distributed dictionary databases. A kernel(10) performs data I/O(Input/Output) between the index/document database volume and a user memory, and manages files, directories, records, and reverse files in the index/document database volume. A storage engine(20) manages catalogs storing metadata for the databases and manages document/indexes by using the kernel. A search engine(30) performs the search for a user's query. An indexer(40) extracts the index for the document inputted from the user by using the dictionary database. A data manager(60) generates the database by receiving a schema file from a manager, loads a bundle of raw documents in bulk, and performs indexing.
Abstract:
PURPOSE: A system and a method for managing information retrieval, and a recording medium recording a program source of the same are provided to economically retrieve information by reducing the unnecessary waste of resources and retrieve the information quickly without lowering system performance by efficiently distributing the resources even if lots of information retrievals are requested. CONSTITUTION: A user terminal(01) receives an information instruction such as an information retrieval instruction and a data management instruction. A work manager(02) outputs a work order instruction by distributing/ordering the work according to the information instruction inputted from the user terminal. The information retrieval tools(03) perform the information retrieval by receiving the work order signal. The databases(06) are connected to the information retrieval tools and store data.
Abstract:
PURPOSE: A feature generating method for recognizing an entity of machine learning is provided to generate a word unit feature suitable of a named entity recognition system. CONSTITUTION: A word in named entity dictionary is discriminated in a paragraph. The kind of word in named entity dictionary is discriminated. A word unit having the kind of named entity is given. The quality of the word by word is generated. The feature of the word unit, which is generated from the named entity dictionary is integrated.
Abstract:
본 발명은 기술용어 간 관계 추출용 테스트 컬렉션 반자동 구축을 위한 시스템에 관한 것으로서, 문헌에 존재하는 기술용어와 이들 간의 연관관계를 언어 자원을 기반으로 시스템적으로 처리하여, 제한된 문헌과 개체들을 기반으로 소규모의 테스트 컬렉션을 구축하는 기존의 접근법에서 벗어나 대규모의 학술 데이터 베이스와 다양한 분야의 전문용어 사전, 그리고 최신의 기계학습 알고리즘을 활용하여 실용적인 테스트 컬렉션을 구축하는 기술용어 간 관계 추출용 테스트 컬렉션 반자동 구축을 위한 시스템을 제공하여, 정형화되고 시간이 많이 소요되는 작업을 자동화시킴으로써, 구축자의 노력을 최소화할 수 있고, 구축자의 성향에 따라 발생하는 결과의 편차를 줄일 수 있는 효과가 있다 테스트 컬렉션, 트리플, 연관관계
Abstract:
본 발명은 그리드 컴퓨팅 기반 과학기술 지식발견 프레임 워크에 관한 것으로서, 그리드 서비스를 정의하고 최종 사용자가 직접적으로 활용할 수 있는 보다 고차원적인 분산 그리드 서비스를 제공하여, 각 단위 엔진에 가장 적합한 리소스를 할당함으로써 전체 성능을 크게 개선시킬 수 있으며, 단위 엔진 별로 요구되는 컴퓨팅 파워나 메모리 공간을 최적화된 상태로 지원함으로써 실행과정 중의 어느 한 부분이 비효율적으로 지연되는 것을 방지할 수 있는 효과가 있다. 그리드, 리소스, 컴퓨팅, 프레임워크, 알고리즘
Abstract:
PURPOSE: A substitute reference solution system and method thereof are provided to improve realizing ratio of core object recognition by distinguishing core object referring to pronoun. CONSTITUTION: An anaphoric pronoun recognizing module(200) recognizes a pronoun having preceding word through the alternative pronoun, the neighboring lexical information and part of speech column information in document. A controller(100) receives the pronoun information. An antecedent extracting module(300) receives pronoun information to find a preceding word which a pronoun infers to. A pronoun recognition module uses a selection of vocabulary unit(210) and unit of a speech selecting unit(220) and recognizes a pronoun in the document.
Abstract:
PURPOSE: A semantic syntactic tree kernel based processing system and method thereof are provided to automatically extract an associative relationship by calculating similarity of two sentences by a semantic syntactic tree. CONSTITUTION: A language analysis unit(110) analyzes CRF(conditional random field) information. A integration quality processing unit(120) receives an analysis result. A similarity extracting unit(130) calculates similarity by calculating a semantic parse tree kernel by the relation of syntax. A similarity extracting unit(130) calculates similarity and semantic syntactic tree kernel.
Abstract:
본 발명은 대용량 데이터베이스의 의미기반 기술용어 발굴 방법에 관한 것으로, 특히, 에이알엠수단, 티알에스수단, 분석수단, 추적수단, 관리 데이터베이스, 과학정보 데이터베이스, 에이알이에스 수단, 이알에이 수단, 지식 데이터베이스를 포함하는 장치에 의하여 대용량 데이터베이스의 의미기반 기술용어를 발굴하는 방법에 있어서, 분석수단에 의하여 과학정보 데이터베이스의 운용부하가 소정 비율로 낮은 경우 에이알엠 수단이 관리 데이터베이스로부터 검색한 질의어를 추출하여 티알에스 수단에 제공하고 티알에스 수단은 질의어에 의하여 과학 데이터베이스로부터 지정된 기술의 문서집합과 해당 포스팅 정보를 추출하여 분석수단에 제공하는 과정; 분석수단은 타스 수단에 의하여 문서집합으로부터 신규와 시드의 기술용어가 검출되면 에이알이에스 수단에 통보하고 지식 데이터베이스에 등록하는 기술용어 과정; 분석수단은 타마 수단에 의하여 문서집합으로부터 신규와 시드의 문맥정보가 검출되면 에이알이에스 수단에 통보하고 지식 데이터베이스에 등록하는 문맥정보 과정; 문서집합과 지식 데이터베이스의 정보를 추적수단에 제공하여 연관된 기술을 추적하고, 추적된 정보를 지식 데이터베이스와 디알에스 수단에 제공하며, 추적된 정보를 분석하여 문서로 출력하는 과정; 을 포함하는 구성을 특징으로 하여, 대용량 데이터베이스의 전체 검색 효율성과 활용성을 높이고, 검색된 기술용어들의 관계를 분석 및 축적하여 기술정보들의 연관 관계, 시계열 분석, 분류 등을 실시간으로 신속하게 검색 및 추적하여 기술검토, 개발 및 의사결정을 신속하게 하는 효과 가 있다. 특허, 논문, 데이터베이스, 검색, 질의어, 기술용어, 문맥정보, 추출