Abstract:
PURPOSE: A generator of Korean vocabulary/abbreviation hyperlink based on HTML is provided to easily and rapidly sample vocabulary/abbreviation by using HTML analyzing technology and morpheme analyzing method. CONSTITUTION: An HTML analyzer(20) samples real document content of an HTML document for automatically generating a hyperlink tag based on HTML/TEXT documents. A morpheme analyzer(30) samples vocabulary/abbreviation through analyzing morphemes. A document formatter(40) generates a hyperlink document. Therefore, vocabulary/abbreviation are sampled by using a vocabulary/abbreviation dictionary(70) and a dependent morpheme dictionary(60) after separating morphemes into independent/dependent morphemes.
Abstract:
PURPOSE: A generator of Korean vocabulary/abbreviation hyperlink based on HTML is provided to easily and rapidly sample vocabulary/abbreviation by using HTML analyzing technology and morpheme analyzing method. CONSTITUTION: An HTML analyzer(20) samples real document content of an HTML document for automatically generating a hyperlink tag based on HTML/TEXT documents. A morpheme analyzer(30) samples vocabulary/abbreviation through analyzing morphemes. A document formatter(40) generates a hyperlink document. Therefore, vocabulary/abbreviation are sampled by using a vocabulary/abbreviation dictionary(70) and a dependent morpheme dictionary(60) after separating morphemes into independent/dependent morphemes.
Abstract:
PURPOSE: A system and a method for automatically classifying documents are provided to accurately obtain information on a document classified by categories, and to search and provide information in which the user is interested. CONSTITUTION: A morpheme analyzer(103) receives documents collected and link titles and extracts related terms. A term clustering generator(101) receives the terms extracted from the morpheme analyzer(103) and extracts keywords by documents. In addition, the term clustering generator(101) generates lists of the keywords by documents and term clusters. A gene learning classification device(102) receives the lists and the term clusters generated from the term cluster generator(101). In addition, the gene learning classification device(102) extracts term clusters for the keywords and infers categories of related fields.
Abstract:
본 발명은 한글정보검색시스템을 구현할 때 이용자가 원하는 정보를 찾기 위하여 입력하는 검색문(질의어)을 시스템 내부적으로 분석하고 실제로 데이타베이스내에 저장된 정보를 가져올 수 있도록 입력된 검색문에 대해서 DBMS 질의어인 SQL(Structured Query Language)로 동적변환해가는 방법에 관한 것이다. 검색문을 변환하고 질의의 결과를 제공하기 위해 6단계의 과정으로 나누었으며, 특히 렉시칼분석 및 연산자 우선순위에 의한 Bottom-Up 파싱방법, 중간코드생성 방법 등은 새로운 알고리즘을 고안하여 구현하였다. 정보검색시스템을 이용할때 이용자가 입력하는 검색문은 성향에 따라 다양하게 구성되며, 검색문은 정적(Static) 프로그램으로도 어느 정도까지는 경우의 수를 고려하여 미리 질의어를 구성해 놓을 수도 있으나 이용자들의 다양한 성향에 의해 작성되는 모든 경우의 검색문을 고려하여 미리 프로그램을 작성하는 것은 거의 불가능하다. 또한 특정 DBMS를 이용할때 DBMS에 의존하지 않고 적합율(Hit Rate)과 재현율을 높일수 있도록 검색시스템을 구현하기 위해서는 정적 프로그램으로 처리하기에는 많은 한계가 있다. 본 발명에 따라 이러한 문제점들이 해결되어질 수 있고 입력되어지는 검색문을 그때그때 시스템에서 분석하여 실제 DBMS의 해당 질의어로 동적변환을 하는 것이다. 정보검색시스템에서의 검색문작성은 시스템의 구성에 따라 상이하지만 여기서는 DBMS를 이용하고 논리연산자(AND, OR, NOT 등)의 조합에 의한 검색문을 작성하도록 되어있는 정보검색시스템에 한해서 적용되도록 하였다.
Abstract:
PURPOSE: A system and method for creating a three dimensional clustering are provided to link a word to a document horizontally and to classify a word and a document based on a directory by grafting the hierarchy terms concept in a clustering method based on the existing similarity. CONSTITUTION: A word extracting device(101) extracts actual contents of an HTML document using an HTML DTD(Document type definition), and extracts an actual word out of filtered contents using an HTML filter and a dictionary(104), and creates an index file(107) by embodying a weight value by words. A cluster creating device(102) extracts a word having a value more than the critical weight value out of words of the corresponding document, and creates a word group(cluster) based on the extracted each word, and compares the word group(cluster) with the existing word group(cluster dictionary:105) based on the corresponding word, and creates new word group(cluster dictionary:105) based on the corresponding word. A 3-D cluster processor(103) checks whether a query language of a user exists in a classification dictionary(106). If a query language of a user does not exist in a classification dictionary, a document value is outputted using a cluster corresponded to the query language and the index file(107) in the cluster dictionary(105). If a query language of a user exists in a classification dictionary, the upper and lower linking word in the classification dictionary(106), a query language and a cluster with respect to the upper and lower linking word in the cluster dictionary(105) based on the upper and lower linking word are searched, and a document value is outputted using the cluster dictionary(105).
Abstract:
PURPOSE: A system for creating and searching multi media data based on a XML and a method for creating multi media data using the system are provided to manufacture and search new-formed multi media data by unifying index information and multi media data based on a XML(extended markup language). CONSTITUTION: A description generator(110) receives a XML document structure for expressing multi media information and multi media data and describes multi media information by the XML document structure and inserts the information into the multi media data, and creates XML multi media data. A multi media data searching server(120) divides the XML multi media data into multi media information and search information and stores the information. The multi media data searching server(120) outputs information by performing a search if a search requesting message is received. A multi media data searching player(130) transmits the search requesting message to the multi media data searching server(120) and receives the XML multi media data from the multi media data searching server(120) and shows the data entirely or as the unit of a scene.
Abstract:
본 발명은 한글정보검색시스템을 구현할 때 이용자가 원하는 정보를 찾기 위하여 입력하는 검색문(질의어)을 시스템 내부적으로 분석하고 실제로 데이타베이스내에 저장된 정보를 가져올 수 있도록 입력된 검색문에 대해서 DBMS 질의어인SQL(Structured Query Language)로 동적변환해가는 방법에 관한 것이다. 검색문을 변환하고 질의의 결과를 제공하기 위해 6단계의 과정으로 나누었으며, 특히 렉시칼분석 및 연산자 우선순위에의한 Bottom-Up 파싱방법, 중간코드생성 방법 등은 새로운 알고리즘을 고안하여 구현하였다. 정보검색시스템을 이용할때 이용자가 입력하는 검색문은 성향에 따라 다양하게 구성되며, 검색문은 정적(Static) 프로그램으로도 어느 정도까지는 경우의 수를 고려하여 미리 질의어를 구성해 놓을 수도 있으나 이용자들의 다양한 성향에 의해작성되는 모든 경우의 검색문을 고려하여 미리 프로그램을 작성하는 것은 거의 불가능하다. 또한 특정 DBMS를 이용할때 DBMS에 의존하지 않고 적합율(Hit Rate)과 재현율을 높일수 있도록 검색시스템을 구현하기 위해서는 정적 프로그램으로 처리하기에는 많은 한계가 있다. 본 발명에 따라 이러한 문제점들이 해결되어질 수 있고 입력되어지는 검색문을 그때그때 시스템에서 분석하여 실제 DBMS의 해당 질의어로 동적변환을 하는 것이다. 정보검색시스템에서의 검색문작성은 시스템의 구성에 따라 상이하지만 여기서는 DBMS를 이용하고 논리연산자(AND, OR,NOT 등)의 조합에 의한 검색문을 작성하도록 되어있는 정보검색시스템에 한해서 적용되도록 하였다.