Abstract:
PURPOSE: A method for constructing a query index database, a method for recommending a query by using the query index database are provided to classify a click document based on a query and click log of a user, thereby classifying and indexing a query language by a concern subject. CONSTITUTION: A representative query language and iso-form query language are selected by normalizing query log data(S403). The data with a clicked document and the query language corresponding to a click log data uses one of machine study-based classification among a naive Bayesian model, a SVM(Support Vector Machine) and a neural network and is classified by a relevant subject(S405). The representative query language and iso-form query language are indexed and saved with information about the relevant subject. Query language which frequency is the highest among query language log data having same URL(Uniform Resource Locator) is selected as the representative query language.
Abstract:
PURPOSE: A device and a method for a personalized search are provided to rearrange the rank of search result based on module analyzing interest filed, thereby improving the information search and function of media search. CONSTITUTION: A model generator(100) analyze interest field of a user through directory classification information of a user terminal. A model generating unit generates an interest analysis model(130). A search engine unit(110) generates search result through an information search engine of a user terminal. A personalization search engine unit(120) generates personalized search result by re-ordering of generated search result based on model of analyzing interest field.
Abstract:
1. 청구범위에 기재된 발명이 속한 기술분야 멀티미디어 검색을 위한 질의 표현 장치 및 방법에 관한 것임. 2. 발명이 해결하고자 하는 기술적 과제 다양한 질의 유형을 MPEG-7 질의 포맷으로 표현하고, 지정된 영역을 재사용할 수 있도록 필드타입을 이용하는 질의 표현 및 멀티미디어 검색을 위한 질의 표현 장치 및 방법을 제공함. 3. 발명의 해결방법의 요지 사용자로부터 멀티미디어 검색을 위한 질의를 입력받는 입력수단 및 상기 입력된 질의를 필드 타입으로 표현하는 표현수단을 포함하되, 상기 필드 타입은 상기 입력된 질의에 포함된 검색 조건을 나타내는 필드의 고유 식별 정보를 나타내는 식별자 정보 상기 필드의 데이터 타입 정보를 나타내는 타입 정보 및 참조를 위해 다른 필드의 상기 식별자 정보를 나타내는 참조 정보 중 적어도 어느 하나를 포함하는 표현 장치를 제공함. 4. 발명의 중요한 용도 MPEG-7 질의 포맷에서 이용됨. MPEG-7, 질의 포맷, 필드타입
Abstract:
A schedule information extraction apparatus and a method thereof providing related information to a user by tracing the change of appointment are provided to classify a mail which and relates to appointment is automatically and extract critical from the classified e-mail information relating to appointment from the classified e-mail. A mail classifying module(100) classifies an e-mail about appointment from a plurality of e-mails. A schedule information extracting module(120) generates a schedule information template and extracts critical information relating to schedule. A schedule information tracking module(140) extracts personal information template from personal information DB. The personal information tracker module traces the changed content of the pertinent schedule based on the time flow. The appointment information is similar with personal information template generated in the personal information extraction module.
Abstract:
A metadata base index/search apparatus and a method thereof for improving search speed and search performance are provided to use a query for the metadata search generated from an inputted user query. A metadata extracting unit(10) extracts metadata from input data. A metadata indexing unit(20) produces index data in which a search object is from the extracted meta data. An index data storage by metadata(30) stores the generated index data according to meta data. A query analyzing unit of the quality produces the query for the metadata search from the query inputted from the user. A metadata searching unit searches index data corresponding to the query for the generated metadata search in the meta data index data storage module.
Abstract:
A query expression device for multimedia search is provided to search MPEG-7 document using various queries and re-search a part designated through the first search. A query expression unit(101) expresses the inputted user query to the query for searching multimedia by using a field type. A query analysis unit(103) interprets meaning of the query expressed in the query expression unit. A search engine(105) searches the multimedia relating to the query interpreted by the query analysis unit. The query expression unit uses the field-type in order to accurately express the meaning of the inputted user query.
Abstract:
An information search method based on ontology is provided to narrow the range of a media list provided as an information search result using a facet such that a user easily finds desired information to solve an information overload problem. At least one selectable facet in which data is searched is displayed(101). The data corresponding to the facet is searched and selected according to an ontology method(107). The facet is displayed in a tree structure from the upper concept to the lower concept. The facet includes media, people, time, places, events and categories.
Abstract:
본 발명은 어휘 개념망 구축을 위한 상위어 자동 추천 방법에 관한 것으로서, 개념망의 이식성과 확장성를 고려하고 객관성 확보를 위해, 기 구축된 개념망에서 표제어의 뜻풀이와 표제어의 상위어 간의 관계를 분석하여 패턴 추출을 위한 기계학습을 수행하고, 학습된 패턴을 기반으로 새로운 표제어를 개념망에 추가할 때, 상위어의 후보들을 선정하여 신뢰값과 함께 작업자에게 제시하는데, 상위어 후보들 중 중의성 표제어가 있으면, 상호정보량(Mutual Information)을 이용한 뜻풀이 유사도를 사용하여 중의성을 해소한 후, 제시된 상위어의 후보들 중 하나를 선택하면 새롭게 입력되는 표제어의 상위어로 선정되도록 하여, 작업 비용와 노력을 상대적으로 많이 줄일 수 있어 다른 분야로의 이식과 확장이 용이하고 객관성을 확보할 수 있다. 개념망, 상위어, 기계학습, 중의성
Abstract:
본 발명은 다양한 문서들에 대한 언어분석을 통해 정답후보 어휘나 구들을 선별하고 이와 관련된 자연어 질문을 자동 생성하여 그 질문/정답 쌍들을 미리 색인 저장함으로써, 사용자 질의시 질문의 유사도 비교를 통해 질의에 대한 양질의 정답후보들을 순위적으로 빠르게 제시하는 언어분석 기반 질의응답 시스템 및 그 방법에 관한 것이다. 본 발명은 문서들의 언어적 구조를 분석하여 문서의 정답유형 및 의미구조를 파악하는 단계; 문서에서 정답 후보문을 선정하는 단계; 정답유형 및 의미구조를 기반으로 정답 후보문에 대한 자연어 질문을 생성하는 단계; 생성된 자연어 질문과 그 정답 후보문을 쌍으로 하여 데이터베이스화하는 단계; 사용자 질의문에 대해 언어구조를 분석하여 적합한 정답유형을 인식하고 그 질의문 의미구조를 파악하는 단계; 사용자 질의문의 내용을 분석하는 단계; 질문분석 결과를 바탕으로 질문/정답쌍 데이터베이스로부터 유사한 자연어 질문들을 검색하는 단계; 및 검색된 자연어 질문들 및 그 정답 후보문을 순위화하여 사용자에게 제시하는 단계로 이루어진다. 정답유형, 질의응답, 자연어 질문, 언어분석, 온톨로지, 개체명 인식
Abstract:
본 발명은 한국어의 언어 및 발음 특성에 따라 각 음운변이 현상에 대한 규칙들을 작성하고, 이를 이용하여 입력 외래어와 동일의미를 갖는 다수의 이형태 음차표기들을 제공함으로써 정보검색, 질의응답시스템 등에서 그 검색 및 응답 성능의 향상을 도모할 수 있는 외래어 음차표기 자동 확장 방법 및 장치에 관한 것이다. 본 발명은 외래어 음차표기 시의 각 음운변이 현상에 대한 규칙들을 생성하고, 각 음운변이 규칙에 대한 가중치를 산출하는 단계; 입력 외래어를 자모의 음소단위로 분할하는 단계; 입력 외래어의 음소열에 해당되는 음운변이 규칙들을 적용하여 다수의 음차표기 후보 음소열들을 생성하는 단계; 각 음차표기 후보 음소열에 그 적용 규칙에 따른 가중치를 부여하여 상위 가중치의 후보 음소열들을 선정 출력하는 단계; 및 선정된 음차표기 후보 음소열에 대한 그 자모의 음소를 합성하여 확장된 외래어 음차표기들을 출력하는 단계;로 이루어진다. 음차표기, 정보검색, 질의응답시스템, 음운변이 규칙, 동음가 테이블, 음운 축약/확장, 음운 대체, 음운 강약, 음운 삽입/탈락