Abstract:
본 발명은 토픽맵을 기반으로 사용자 질문에 대한 답변을 검색하는 기법에 관한 것으로, 이를 위하여 본 발명은, FAQ(Frequently Asked Questions) 리스트 검색과 대화형 DB 검색을 통합적으로 수행하거나, 신뢰도에 따라 커뮤니티를 검색하거나, FAQ 웹 페이지들을 사용해서 자연어 질문에 대해 답변을 검색하는 종래 방법과는 달리, 커뮤니티 Q/A 리스트들을 토픽맵 기반으로 커뮤니티 Q/A 토픽맵으로 저장해 두고, 사용자 질문이 입력되면 사용자 질문에 대한 전처리 및 분석 과정을 통해 질문 분석 정보를 획득하며, 이러한 질문 분석 정보에 따라 커뮤니티 Q/A 토픽맵에서 유사 질문들을 검색하여 이를 순위화하여 그에 대응하는 정답을 추출 및 출력함으로써, 토픽맵 기반의 커뮤니티 Q/A 토픽맵을 이용하여 정확한 답변을 검색할 수 있는 것이다. 토픽맵(Topic Map), 커뮤니티 Q/A(Question/Answer) 리스트
Abstract:
개인 휴대 단말기에 저장된 개인 정보 및 미디어 파일의 메타데이터 기반 색인 및 검색 장치와 그 방법이 개시된다. 휴대 단말기는 메타데이터 추출부로 수신된 개인 정보 또는 미디어 파일을 입력받아 메타데이터를 추출한다. 이렇게 추출된 메타데이터는 메타데이터 색인부로 입력되고, 형태소 분석 또는 n-gram 분석을 통해 개별 메타데이터별 색인 데이터를 생성하여 저장한다. 사용자가 검색하고자 하는 개인 정보 또는 미디어 파일에 관련된 사용자 질의를 질의 분석부로 입력하면, 이를 분석하여 메타데이터 검색부로 입력한다. 메타데이터 검색부는 메타데이별 색인 데이터 및 통합 메타데이터 색인 데이터를 찾아 그 검색 결과를 출력한다. 이에 따라, 휴대 단말기에서 생성된 모든 개인 정보 및 미디어 파일에 대하여 통합 또는 개별 메타데이터를 지정하여 검색 결과를 제공한다.
Abstract:
본 발명은 문서 데이터의 키워드 추출 및 연관어 네트워크 구성 기술에 관한 것으로, 블로그 문서 집합에서 문서의 제목, 문서의 사용자 태그 및 문서 본문을 분석하여 이슈 키워드 추출부에서 문서 집합 안에서 이슈가 된 키워드를 추출하고 추출된 키워드 간에 공기하는 빈도 및 공기한 태그 정보를 이용하여 키워드 간의 연관성을 파악하고, 연관어 네트워크 구성부에서 연관 네트워크에 대한 정보를 키워드 추출부에서 추출된 키워드와 함께 키워드 및 연관 네트워크 색인 데이터에 저장한다. 또한, 사용자가 처음 이 데이터에 접근하면, 가장 이슈가 된 순서대로 키워드 리스트를 제공하고 사용자 요구가 있을 경우 키워드 및 연관어 네트워크 제시부에서 사용자가 요구한 키워드 및 이와 관련된 색인 정보를 키워드 및 연관어 네트워크 색인 데이터에 실시간으로 접근한 후, 연관어 네트워크를 구성하여 결과를 제시하는 것을 특징으로 한다. 본 발명에 의하면, 블로그 문서 집합에서 자동으로 이슈가 되는 키워드를 추출하고, 추출된 키워드 간의 연관 네트워크를 구성하여 각 문서별로 정확한 키워드를 나타낼 수 있으며, 특정 기간에 수집된 블로그 문서 집합에 대해서 사용자는 모든 문서를 탐색해 보지 않더라도 자주 쓰인 이슈 키워드의 순위와 이와 연관된 키워드를 네트워크 형태로 시각적으로 쉽게 접근하게 되어 블로그 문서 집합의 내용을 쉽게 알 수 있다. 블로그, 이슈 키워드, 연관어 네트워크, 태그
Abstract:
PURPOSE: A system and method for constructing named entity dictionary are provided to easily build a named entity dictionary by extracting named entities from a certain type of information included in a web document such as a table or list, and using the named entities. CONSTITUTION: A web document collector (110) collects web documents. An information extractor(130) extracts the table or list type information from the web documents. A name entity extractor(140) extracts the name entities from the table or list type information. The name entity dictionary(160) stores the extracted named entities. An address extractor(120) extracts the address of the web document by analyzing the web document. The web document analyzer transmits the extracted address to the web document collector.
Abstract:
PURPOSE: A method and apparatus for automatically finding synonyms are provided to establish synonyms of keywords based on the statistical information between keywords and the morphological similarity by using large scale web keywords and a click log. CONSTITUTION: An allomorph candidate generator(101) generates allomorph candidates for search keywords by using a keyword log for the search keywords or the user session information. A synonym extracting unit(102) for verification extracts verification synonym from web documents by using synonym patterns. The allomorph generating unit(103) removes over-generated or error candidates from the allomorph candidates and generates allomorphs for the search keywords using the synonym for verification.
Abstract:
PURPOSE: A device and method for classifying a document of a single class category are provided to perform exact document classification by using an association rule extracted by an association rule detection method as a quality for document classification. CONSTITUTION: An associative rule training unit(100) generates matrices of qualities from a learning document set to generate an association rule candidate with a depth or widths primary search method. The associative rule training unit generates an associative rule training model from association rules candidates. A document class category classifier(150) uses an association rules learning model to classify a document of a document set.
Abstract:
PURPOSE: A device and a method for processing web information by extracting local information are provided to integrate various web information around related regional information to provide processed document data. CONSTITUTION: A major information extracting unit(150) extracts major information including regional information from document data according to a result of language analysis and a selected topic. A related information mapping unit(170) groups and maps the document data. An information integrating unit(180) compares the mapped document data. The information integrating unit integrates the document data according to the comparison result.
Abstract:
PURPOSE: A device and a method for keyword extraction and an associative word network configuration of document data are provided to extract automatically issue key word from a Blog document group and constitute an associative network in between extracted key words, thereby showing exact keyword according to each document. CONSTITUTION: An issue keyword extractor(104) parses structure information of a document in an inputted web document group. An issue keyword extractor extracts an issue keyword based on analyzed morpheme. An associative work network configurator(106) extracts relations between extracted issue keywords. An indexing unit(108) indexes extracted issue keywords and configured associated word network. According to a control command, a presentation unit(114) suggests the issue keyword and associated word network information.
Abstract:
PURPOSE: A topic map based indexing device, a topic map based searching device, a topic map based searching system and a method thereof are provided to obtain question analyzing information about question of a user and search similar questions in a community Q/A topic map according to question analyzing information and effectively outputs an answer, thereby searching most suitable answer. CONSTITUTION: A Q/A pre-processing block(102) normalizes the community Q/A list as monolithic. A Q/A analysis block(104) obtains Q/A analyzing information through analyze of the community Q/A list. A Q/A stores block stores indexing information through duplicated answer removal, meaningless answer removal, an answer list sorting, extracting answer of the top order and topic decision according to the Q/A analyzing information as community Q/A topic map.