Abstract:
PURPOSE: An electronic document processing device and a method thereof are provided to determine duplicated document according to duplicate sentence rate of electronic document and reduce target electronic document effectively, thereby increasing efficiency of query response. CONSTITUTION: A sentence separation block(106) separates each sentence in extracted body content. A duplicated document decision block(108) changes the separated documents through hash algorithm to inherent hash value. According to collision between the changed hash value and pre-stored hash value, the duplicated document decision block determines duplicated sentence. The duplicated document decision block determines duplicated document according to duplicated document ratio of the electronic document.
Abstract:
1. 청구범위에 기재된 발명이 속한 기술분야 복수의 이미지 셋을 포함하는 비디오 시퀀스에 대한 감소된 비트를 갖는 에지 히스토그램 기술자의 비트 표현을 구성하는 방법 및 상기 에지 히스토그램 기술자의 부호화된 표현으로부터 효과적으로 추출된 정보를 이용하여 비디오 시퀀스를 검색하는 방법에 관한 것임. 2. 발명이 해결하고자 하는 기술적 과제 텍스쳐 비디오를 포함하는 대응 비디오 시퀀스를 검색하는 방법을 제공함. 3. 발명의 해결 방법의 요지 복수의 비디오 시퀀스를 표현하는 디지털 비디오 데이터 정보 - 상기 복수의 비디오 시퀀스 각각은 상기 디지털 비디오 데이터의 이미지 프레임 셋을 포함함 - 를 갖는 데이터베이스 구축 방법에 있어서, 상기 각 비디오 시퀀스의 상기 각 이미지 프레임을 L개(L은 양의 정수)의 부영상(sub-image) - 상기 각 부영상은 S x T개(S 및 T는 각각 양의 정수)의 이미지 블럭(image-block)으로 더욱 분할됨 - 으로 분할하는 제1단계; 상기 각 이미지 블럭에 대해 5개의 기준 에지(reference edge) - 상기 기준 에지는 4개의 방향성(directional) 에지 및 1개의 무방향성(non-directional) 에지를 포함함 - 중 어느 하나를 할당하여 상기 각 이미지 프레임에 대해 L개의 에지 히스토그램(edge histogram) - 상기 에지 히스토그램은 M개의 에지 히스토그램 빈(edge histogram bin)을 포함함 - 을 생성하는 제2 단계; 상기 각 에지 히스토그램에 포함된 상기 에지 히스토그램 빈을 S x T로 정규화하여 상기 각 이미지 프레임에 대해 M개의 정규화된 에지 히스토그램 빈을 생성하는 제3단계; 상기 각 이미지 프레임의 정규화된 에지 히스토그램 빈에 기초하여 상기 각 비디오 시퀀스에 대한 L개의 대표(representative) 에지 히스토그램을 생성하기 위해 상기 각 비디오 시퀀스에 대해 M개의 대표 에지 히스토그램 빈을 계산하는 제4단계; 및 상기 데이터베이스에 저장되는 상기 각 대표 에지 히스토그램에 대한 제2이미지 기술자로서 M개의 양자화 인덱스값을 생성하기 위해 상기 대표 에지 히스토그램 빈을 비선형적으로 양자화하는 제5단계를 포함함. 4. 발명의 중요한 용도 비디오 시퀀스 검색에 이용됨.
Abstract:
본 발명은 온톨로지의 도메인 정보를 이용한 문서 요약 장치 및 방법에 관한 것으로, 온톨로지의 도메인 정보를 이용하여 문서를 효과적으로 요약하기 위한 장치 및 방법을 제공하는 데 있다. 이를 위하여 본 발명의 일실시 예에 따른 문서 요약 방법은, 문서 요약 장치가 온톨로지 구축을 위하여 입력되는 문서를 기반으로 온톨로지를 자동으로 구축하는 단계; 상기 문서 요약 장치가 요약을 위하여 입력되는 문서를 형태소 분석하여 명사를 추출하는 단계; 상기 문서 요약 장치가 상기 온톨로지로부터 상기 명사의 도메인을 추출하는 단계; 및 상기 문서 요약 장치가 상기 도메인으로 구성되는 요약본을 생성하는 단계를 포함한다. 그럼으로써, 본 발명은, 온톨로지의 도메인 정보를 이용하여 문서의 요약본을 효과적으로 생성할 수 있는 이점이 있다. 온톨로지, 도메인, 문서 요약
Abstract:
본 발명에 따른 음성 대화 분석 시스템은 음성 대화 시스템에서 빈번히 발생할 수 있는 생략어나 대용어를 통계적 방법 및 규칙 기반 오류 후처리에 의해서 자동으로 인식하여 복원하여줌으로써, 사용자 확인 절차를 간소화시켜 사용자 편의성을 높이고 사용자의 간단한 발화에 시스템이 지능적으로 대처할 수 있게 한다. 음성, 대화, 분석, 생략어, 대용어, 복원
Abstract:
본 발명은 HTML(Hyper Text Mark-up Language) 웹 문서의 특징인 구조화된 문서로부터 정보를 추출하는 방법에 관한 것으로, 영역 적응성을 높이기 위한 구조정보 반자동 추출 기술에 관한 것이다. 본 발명은 사용자 간섭을 최소화하기 위해 기계학습을 기반으로 하고 있으며, 영역 내 사이트간의 적응성을 높이기 위해 학습모델을 영역과 사이트 별로 나누어 학습하는 2단계의 자질학습 방법을 포함한다. 본 발명에 의하면, 웹 사이트의 일부 소량의 데이터만 수작업으로 태깅(tagging)하여 학습하더라도 해당 웹 사이트의 속성들을 자동으로 대량 추출이 가능하며, 2단계의 학습모델을 사용함으로 인해, 한 사이트에서 학습한 정보를 같은 영역의 타 사이트에도 적용이 될 수 있기 때문에 사이트가 바뀔 때마다 매번 새로운 추출패턴 등의 리소스(resource)를 구축해야하는 부담을 덜어줌으로써 동 영역내 사이트 간의 적응성을 높이는 장점이 있다. 구조정보, 랩퍼(Wrapper), XHTML(eXtensible Hyper Text Mark-up Language), DOM(Document Object Model)
Abstract:
본 발명은 사용자 요구에 따라 정보를 제공하기 위한 장치 및 방법에 관한 것으로서, 보다 상세하게는 사용자로부터 수신한 대화형 입력에 기반하여 사용자의 요구를 분석하고 이에 대응하는 정보를 제공하는 대화형 정보 제공 서비스 장치 및 방법에 관한 것이다. 본 발명에 따른 대화형 정보 제공 서비스 장치는 사용자로부터 수신된 입력문을 분석하는 대화문 분석부; 상기 대화문분석부의 분석결과를 이용하여 상기 사용자의 요구를 분석하는 대화 관리부; 상기 대화관리부로부터 실시간 정보 갱신요청이 있는 경우, 웹상에 갱신되는 일상생활 정보를 실시간으로 추출하여 일상정보 데이터베이스에 저장하는 실시간 자동 지식 구축부; 상기 대화관리부에서 분석된 상기 사용자의 요구에 대한 응답을 생성하고 사용자에게 응답을 제공하는 응답 생성부; 및 상기 사용자의 요구에 응답이 불가능한 경우 또는 상기 사용자의 요구에 대한 응답에 오류가 있는 경우, 상기 사용자로 하여금 상기 사용자의 요구를 취소할 수 있도록 하고 시스템을 복원하는 예외 처리부로 구성된다. 본 발명은 대화형 입력에 기반하여 사용자의 요구를 분석하고 이에 대응하는 정보를 제공함으로써, 사용자가 편리하게 필요한 정보를 획득하도록 할 수 있다. 음성대화 시스템, 대화관리, 실시간 지식 구축, 예외처리, 오류복원
Abstract:
A method and an apparatus for retrieving multimedia contents are provided to analyze the meaning of an inquiry of a user correctly in a retrieving operation, thereby correctly retrieving multimedia contents corresponding to the inquiry. An inquiry of a user is represented by using a pointer which points a specific region of an MPEG-7 document and a reference which refers to the pointer(10). The meaning of the inquiry represented by using the pointer and the reference is analyzed(20). Multimedia contents corresponding to the inquiry are retrieved according to the analysis result(30).
Abstract:
본 발명은 계층적 분류에 의한 정보 표시 장치에서 정보를 표시하는 방법에 있어서,적어도 2개의 미리 결정된 온톨로지(Ontology) 의미 구조 클래스(Class)에 상응하는 제1 분류 기준이 선택되는 단계, 상기 선택된 각각의 제1 분류 기준에 상응하는 정보를 검색하는 단계, 상기 검색된 정보를 상기 제1 분류 기준의 하위 온톨로지(Ontology) 의미 구조 클래스(Class)인 제2 분류 기준에 상응하여 분류하는 단계, 상기 적어도 2개의 제1 분류 기준을 각각 한 축으로 하고 상기 제2 분류 기준을 축의 성분으로 하는 행렬을 생성하는 단계, 상기 성분이 선택되면 상기 성분에 상응하는 적어도 2개의 제2 분류기준을 각각 한 축으로 하고 상기 제2 분류 기준의 하위 온톨로지(Ontology) 의미 구조 클래스(Class)를 축의 성분으로 하는 하위 행렬을 생성하는 단계를 포함하되, 상기 생성된 행렬의 각 원소는 상기 원소의 위치에 상응하는 적어도 2개의 제2 분류 기준에 의해 동시에 분류된 정보를 포함하고, 상기 행렬의 각 원소는 타일바(Tile Bar) 형태로 구성되며, 상기 타일바는 상기 타일바에 상응하는 원소가 포함하는 정보의 양에 따라 각각 상이한 색상을 가지는 것을 특징으로 하는 계층적 분류에 의한 정보 표시 방법을 제공한다. 정보 표시, 계층, 분류, 온톨로지(Ontology)
Abstract:
본 발명은 데이터를 검색할 적어도 하나의 선택할 수 있는 구분자(Facet)를 표시하는 단계 및 적어도 하나의 선택된 구분자(Facet)에 상응하여 데이터를 온톨로지(Ontology) 방식에 의해 검색하고 선택하는 단계를 포함하되, 구분자는 상위 개념부터 하위 개념까지 트리 구조로 표시되는 것을 특징으로 하는 온톨로지 기반의 정보 검색 방법을 제공할 수 있다. 온톨로지(Ontology), 정보 검색
Abstract:
A device and a method for searching multimedia with metadata are provided to search the multimedia data easily without directly receiving a query made in the MPEG(Moving Picture Experts Group)-7 metadata from a user by using query property of an MPEG-7 query format and mapping information of the MPEG-7 metadata. A mapping information storing part(40) stores/manages the mapping information between the MPEG-7 query property and MPEG-7 metadata items. A query property mapper(20) obtains the MPEG-7 metadata items mapped to the MPEG-y query property according to the user query by using the mapping information. A query input part(10) generates and outputs an MPEG-7 query according to the MPEG-7 query format from the user query. The query property mapper generates and outputs the MPEG-7 metadata query by using the mapped MPEG-7 metadata items. A searcher(30) searches the multimedia by using the MPEG-7 metadata query.