Abstract:
본 발명은 그리드 컴퓨팅 기반 과학기술 지식발견 프레임 워크에 관한 것으로서, 그리드 서비스를 정의하고 최종 사용자가 직접적으로 활용할 수 있는 보다 고차원적인 분산 그리드 서비스를 제공하여, 각 단위 엔진에 가장 적합한 리소스를 할당함으로써 전체 성능을 크게 개선시킬 수 있으며, 단위 엔진 별로 요구되는 컴퓨팅 파워나 메모리 공간을 최적화된 상태로 지원함으로써 실행과정 중의 어느 한 부분이 비효율적으로 지연되는 것을 방지할 수 있는 효과가 있다. 그리드, 리소스, 컴퓨팅, 프레임워크, 알고리즘
Abstract:
PURPOSE: A substitute reference solution system and method thereof are provided to improve realizing ratio of core object recognition by distinguishing core object referring to pronoun. CONSTITUTION: An anaphoric pronoun recognizing module(200) recognizes a pronoun having preceding word through the alternative pronoun, the neighboring lexical information and part of speech column information in document. A controller(100) receives the pronoun information. An antecedent extracting module(300) receives pronoun information to find a preceding word which a pronoun infers to. A pronoun recognition module uses a selection of vocabulary unit(210) and unit of a speech selecting unit(220) and recognizes a pronoun in the document.
Abstract:
PURPOSE: A semantic syntactic tree kernel based processing system and method thereof are provided to automatically extract an associative relationship by calculating similarity of two sentences by a semantic syntactic tree. CONSTITUTION: A language analysis unit(110) analyzes CRF(conditional random field) information. A integration quality processing unit(120) receives an analysis result. A similarity extracting unit(130) calculates similarity by calculating a semantic parse tree kernel by the relation of syntax. A similarity extracting unit(130) calculates similarity and semantic syntactic tree kernel.
Abstract:
본 발명은 대용량 데이터베이스의 의미기반 기술용어 발굴 방법에 관한 것으로, 특히, 에이알엠수단, 티알에스수단, 분석수단, 추적수단, 관리 데이터베이스, 과학정보 데이터베이스, 에이알이에스 수단, 이알에이 수단, 지식 데이터베이스를 포함하는 장치에 의하여 대용량 데이터베이스의 의미기반 기술용어를 발굴하는 방법에 있어서, 분석수단에 의하여 과학정보 데이터베이스의 운용부하가 소정 비율로 낮은 경우 에이알엠 수단이 관리 데이터베이스로부터 검색한 질의어를 추출하여 티알에스 수단에 제공하고 티알에스 수단은 질의어에 의하여 과학 데이터베이스로부터 지정된 기술의 문서집합과 해당 포스팅 정보를 추출하여 분석수단에 제공하는 과정; 분석수단은 타스 수단에 의하여 문서집합으로부터 신규와 시드의 기술용어가 검출되면 에이알이에스 수단에 통보하고 지식 데이터베이스에 등록하는 기술용어 과정; 분석수단은 타마 수단에 의하여 문서집합으로부터 신규와 시드의 문맥정보가 검출되면 에이알이에스 수단에 통보하고 지식 데이터베이스에 등록하는 문맥정보 과정; 문서집합과 지식 데이터베이스의 정보를 추적수단에 제공하여 연관된 기술을 추적하고, 추적된 정보를 지식 데이터베이스와 디알에스 수단에 제공하며, 추적된 정보를 분석하여 문서로 출력하는 과정; 을 포함하는 구성을 특징으로 하여, 대용량 데이터베이스의 전체 검색 효율성과 활용성을 높이고, 검색된 기술용어들의 관계를 분석 및 축적하여 기술정보들의 연관 관계, 시계열 분석, 분류 등을 실시간으로 신속하게 검색 및 추적하여 기술검토, 개발 및 의사결정을 신속하게 하는 효과 가 있다. 특허, 논문, 데이터베이스, 검색, 질의어, 기술용어, 문맥정보, 추출
Abstract:
A system and a method for analyzing morphemes of Hangul for automatic indexing are provided to index a large size of data automatically and efficiently to maximize a word analysis speed, and modularize and structure a morpheme analyzer. A dictionary manager(100) manages an analysis dictionary by managing a dictionary database. A morpheme analyzer(200) performs a morpheme analysis by receiving an analysis dictionary management result, and modularizing more than one of uninflected word, inflected word, numeric word, non-registration, independent word, and morpheme analyses. An index provider(300) provides an index by receiving a morpheme analysis result from the morpheme analyzer. The dictionary manager manages more than one of a part-of-speech dictionary, a functionality dictionary, and a form morpheme dictionary as the analysis database. The morpheme analyzer includes an uninflected word analyzing module(210), an inflected word analyzing module(220), a numeric word analyzing module(230), a non-registration analyzing module(240), an independent word analyzing module(250), and a type morpheme analyzing module(260).
Abstract:
본 발명은 정보검색명령 및 자료관리명령 등의 정보명령을 입력하는 사용자 단말기; 상기 사용자 단말기로부터 상기 정보명령을 입력받아 상기 정보명령에 따른 작업 수행을 분배하여 지시하는 작업지시 신호를 출력하는 작업관리 수단; 상기 작업지시 신호를 입력받아 정보검색을 수행하는 복수개의 정보검색 수단; 및 상기 정보검색 수단에 연결되며, 다수의 데이터를 저장하고 있는 복수개의 데이터 베이스를 포함하며, 상기 작업관리 수단은 상기 복수개의 정보검색 수단 중 작업을 하지 않는 정보검색 수단을 선별하여 작업지시를 하도록 하는 작업 지시 신호를 출력하며, 상기 복수개의 정보검색 수단은 상기 복수개의 데이터 베이스에 각각 연결되고, 연결된 데이터 베이스에 대해 정보검색을 각각 수행하는 복수개의 쓰레드를 포함하는 것을 특징으로 하는 정보검색관리시스템을 제공함으로써 대용량의 작은 데이터 갱신을 안정적으로 수행할 수 있는 정보검색이 가능하도록 한다.
Abstract:
PURPOSE: A MapReduce based dispersion parallel entity extracting system and a method thereof are provided to guarantee shortened entity extracting response time by extracting entity based on a MapReduce framework. CONSTITUTION: A master server device(100) distributes target document data to slave server devices(200a-200N) by dividing an input document into the target document data. The slave server device converts the target document data into a data format which is able to be processed in a MapReduce framework, divides the content of the converted document into sentences, and divides the divided sentences into construction units. The slave server device extracts the combination of the construction units as entity candidates and defines a relationship between the extracted entities. [Reference numerals] (100) Master server; (200a) Slave server 1; (200b) Slave server 2; (200N) Slave server N;
Abstract:
PURPOSE: A web search based word recognition method and a device thereof are provided to use a web search result for a word candidate extracted from a document group as statistical information for assigning a weighted value for the word candidate, thereby reflecting the weighted value and recognizing a new word. CONSTITUTION: A word candidate extraction unit obtains part of speech information and original word information by analyzing sentences of an input document. The word candidate extraction unit extracts word candidates by using the part of speech information, the original word information, and a stored word candidate pattern. A quality extraction unit obtains basic quality for the word candidates and web quality of a web search result(S306). A word recognition unit assigns a weighted value by applying machine learning to the basic quality and the web quality and recognizes a word candidate which the weighted value is the highest as a word(S308). [Reference numerals] (AA) Start; (BB) End; (S302) Extracting word candidates by analyzing an input document; (S304) Obtaining basic quality for the extracted word candidates and web quality of a web search result; (S306) Obtaining basic quality of each word candidate and web quality of the web search result; (S308) Recognizing a word candidate which the weighted value is the highest as a word
Abstract:
PURPOSE: A system for extracting relation between technical terms from bulk bibliographic information using a verb base pattern based on tama is provided to use a TAMA(Tech Association Mining Appliance) which recognizes relation between a technical term included in text and the technical terms, thereby extracting a verb based pattern centric relation from an abstract and bibliography database over science technique field. CONSTITUTION: If sentences extracted from database by using IIFP(Integrated Information & Function Provider) for STM(Scientific Tech Mining)(190) is applied, a TRD(Target Relation Determiner)(200) performs detailed analysis process by a sentence unit. If a candidate relation set is generated based on a conceptualized lexical clue, the TRD determines a core relation among the relations. If a final target relation is determined in the TRD and whole preparation for actual relation extraction is prepared, a SSREE(Semi-Supervised Relation Extractor)(220) and a SREE(Supervised Relation Extractor)(230) are performed.