Abstract:
A system and a method for analyzing morphemes of Hangul for automatic indexing are provided to index a large size of data automatically and efficiently to maximize a word analysis speed, and modularize and structure a morpheme analyzer. A dictionary manager(100) manages an analysis dictionary by managing a dictionary database. A morpheme analyzer(200) performs a morpheme analysis by receiving an analysis dictionary management result, and modularizing more than one of uninflected word, inflected word, numeric word, non-registration, independent word, and morpheme analyses. An index provider(300) provides an index by receiving a morpheme analysis result from the morpheme analyzer. The dictionary manager manages more than one of a part-of-speech dictionary, a functionality dictionary, and a form morpheme dictionary as the analysis database. The morpheme analyzer includes an uninflected word analyzing module(210), an inflected word analyzing module(220), a numeric word analyzing module(230), a non-registration analyzing module(240), an independent word analyzing module(250), and a type morpheme analyzing module(260).
Abstract:
본 발명은 정보검색명령 및 자료관리명령 등의 정보명령을 입력하는 사용자 단말기; 상기 사용자 단말기로부터 상기 정보명령을 입력받아 상기 정보명령에 따른 작업 수행을 분배하여 지시하는 작업지시 신호를 출력하는 작업관리 수단; 상기 작업지시 신호를 입력받아 정보검색을 수행하는 복수개의 정보검색 수단; 및 상기 정보검색 수단에 연결되며, 다수의 데이터를 저장하고 있는 복수개의 데이터 베이스를 포함하며, 상기 작업관리 수단은 상기 복수개의 정보검색 수단 중 작업을 하지 않는 정보검색 수단을 선별하여 작업지시를 하도록 하는 작업 지시 신호를 출력하며, 상기 복수개의 정보검색 수단은 상기 복수개의 데이터 베이스에 각각 연결되고, 연결된 데이터 베이스에 대해 정보검색을 각각 수행하는 복수개의 쓰레드를 포함하는 것을 특징으로 하는 정보검색관리시스템을 제공함으로써 대용량의 작은 데이터 갱신을 안정적으로 수행할 수 있는 정보검색이 가능하도록 한다.
Abstract:
PURPOSE: A MapReduce based dispersion parallel entity extracting system and a method thereof are provided to guarantee shortened entity extracting response time by extracting entity based on a MapReduce framework. CONSTITUTION: A master server device(100) distributes target document data to slave server devices(200a-200N) by dividing an input document into the target document data. The slave server device converts the target document data into a data format which is able to be processed in a MapReduce framework, divides the content of the converted document into sentences, and divides the divided sentences into construction units. The slave server device extracts the combination of the construction units as entity candidates and defines a relationship between the extracted entities. [Reference numerals] (100) Master server; (200a) Slave server 1; (200b) Slave server 2; (200N) Slave server N;
Abstract:
PURPOSE: A web search based word recognition method and a device thereof are provided to use a web search result for a word candidate extracted from a document group as statistical information for assigning a weighted value for the word candidate, thereby reflecting the weighted value and recognizing a new word. CONSTITUTION: A word candidate extraction unit obtains part of speech information and original word information by analyzing sentences of an input document. The word candidate extraction unit extracts word candidates by using the part of speech information, the original word information, and a stored word candidate pattern. A quality extraction unit obtains basic quality for the word candidates and web quality of a web search result(S306). A word recognition unit assigns a weighted value by applying machine learning to the basic quality and the web quality and recognizes a word candidate which the weighted value is the highest as a word(S308). [Reference numerals] (AA) Start; (BB) End; (S302) Extracting word candidates by analyzing an input document; (S304) Obtaining basic quality for the extracted word candidates and web quality of a web search result; (S306) Obtaining basic quality of each word candidate and web quality of the web search result; (S308) Recognizing a word candidate which the weighted value is the highest as a word
Abstract:
PURPOSE: A system for extracting relation between technical terms from bulk bibliographic information using a verb base pattern based on tama is provided to use a TAMA(Tech Association Mining Appliance) which recognizes relation between a technical term included in text and the technical terms, thereby extracting a verb based pattern centric relation from an abstract and bibliography database over science technique field. CONSTITUTION: If sentences extracted from database by using IIFP(Integrated Information & Function Provider) for STM(Scientific Tech Mining)(190) is applied, a TRD(Target Relation Determiner)(200) performs detailed analysis process by a sentence unit. If a candidate relation set is generated based on a conceptualized lexical clue, the TRD determines a core relation among the relations. If a final target relation is determined in the TRD and whole preparation for actual relation extraction is prepared, a SSREE(Semi-Supervised Relation Extractor)(220) and a SREE(Supervised Relation Extractor)(230) are performed.
Abstract:
본 발명은 지식베이스 구축 방법에 있어서, 스키마 항목을 정의하고, 파일, 난이도 및 도달 목표 중 적어도 하나를 포함하는 자원 정보가 입력되면, 그 자원 정보에 대한 고유한 식별자를 생성하고, 상기 입력된 자원 정보를 분석하여 속성 정보를 추출하고, 상기 추출된 각 속성 정보를 상기 정의된 스키마 항목에 따라 연관 관계를 설정하여 저장하는 것으로서, 분야 전문가들이 가지고 있는 특정 자원에 대한 난이도 정보, 현재 분야의 하부 요소 분야들에 대한 연구 순서에 대한 지식 등을 직접 지식베이스에 표현할 수 있다. 지식베이스, 자원, 속성, RDF
Abstract:
본 발명은 데이터베이스(DB) 정보를 검색하고 관리하는 정보검색 관리 시스템 및 그 방법에 관한 것으로, 데이터베이스에 대한 검색기능 외에 안정적인 관리 기능을 추가시켜 구성함으로써, 저비용 및 고효율의 정보시스템 구축이 가능한 효과가 있다. 이를 위한 본 발명에 의한 정보검색 관리 방법은 잡 스케줄러, 제 1 내지 제 n 파이어, 셋 매니저, 데이터 매니저를 포함하는 정보검색 관리시스템의 정보검색 관리 방법에 있어서, 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 데이터베이스의 정보를 요청하여 수신받는 제 1 단계; 상기 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 데이터베이스의 섹션 리스트를 요청하여 수신받는 제 2 단계; 상기 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 검색을 요청하여 검색 결과를 수신받는 제 3 단계; 상기 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 유사문서검색을 요청하여 검색 결과를 수신받는 제 4 단계; 상기 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 검색 결과 리스트를 요청하여 수신받는 제 5 단계; 및 상기 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 문서의 원문을 요청하여 수신받는 제 6 단계를 포함하여 구성된 것을 특징으로 한다.
Abstract:
PURPOSE: A deep knowledge providing method based on a scientific knowledge memory and a device thereof are provided to analyze literature of a specific science field and copy a complex process which learns knowledge by using natural language processing and mining technology, thereby automatically extracting and accumulating specialized knowledge. CONSTITUTION: A knowledge memory(304) stores relational knowledge, structural knowledge, and procedural knowledge for a document. A deep knowledge providing unit(306) inputs a query language. The deep knowledge providing unit searches and provides a triple which includes the query language and documents related to the triple. The deep knowledge providing unit uses a GCL(Generalized Concordance Lists) query which searches a specific word or a relation between word sets or between words. [Reference numerals] (302) Multidimensional knowledge generating technology; (304a) Relational knowledge memory; (304b) Structural knowledge memory; (304c) Procedural knowledge memory; (306) Deep knowledge providing technology; (AA) Large scholarly information; (BB) Deep knowledge delivery by field