-
公开(公告)号:KR101229401B1
公开(公告)日:2013-02-05
申请号:KR1020100133268
申请日:2010-12-23
Applicant: 전남대학교산학협력단
Abstract: 검색 결과를 링크형태가 아닌 융합된 정보를 사용자에게 즉시 제공하여 검색결과를 다시 검색해야하는 사용자들의 불편을 해소할 수 있도록, 베이즈정리를 사용하여 특정 정보를 가진 웹 페이지의 특징여부를 분류하고 특징들이 출현했을 경우 어떤 웹 페이지에 해당하는가를 참조할 수 있는 확률을 학습하고 온톨로지 데이터사전을 구축하여 단어들이 어떤 항목과 연관을 가지며 어떤 단어와 동일한 뜻으로 사용할 수 있는지 작성하고 다양한 단어를 하나로 통일하기 위한 고유의 명칭을 작성하는 전처리단계와, 사용자가 키워드를 입력하면 크롤러가 순환하면서 웹 페이지 주소를 가져오고 래퍼는 주소를 참조하여 웹 페이지 데이터를 추출하고 웹 페이지의 정보에 분류한 특징을 포함하고 있는지 여부를 판단하고 불용어와 중복어를 제거한 후 각 어간의 원형을 복원하는 작업을 수행하는 정보추출단계와, 온톨로지 데이터 사전에 따라 데이터들이 어떤 카테고리의 범주에 속해 있는지를 분석하고 베이즈정리를 통하여 학습된 통계를 토대로 나이브베이즈 방법을 사용하여 키워드와 추출된 웹 페이지 간의 관련성 여부를 분석하는 신뢰도 평가단계와, 저장된 데이터들을 정해진 다수의 카테고리로 검색하여 통합된 하나의 새로운 명칭을 부여하는 메타데이터 구축단계를 포함하는 웹페이지의 이질적 데이터 정보융합 제공방법을 제공한다.
-
公开(公告)号:KR1020120071645A
公开(公告)日:2012-07-03
申请号:KR1020100133268
申请日:2010-12-23
Applicant: 전남대학교산학협력단
CPC classification number: G06F17/30864 , G06F17/18 , G06F17/2755 , G06F17/30666 , G06F17/3071 , G06F17/30722 , G06F17/30734
Abstract: PURPOSE: A heterogeneous data fusing/supplying system of a web page and a method thereof are provided to supply a convenient searching result to a user by integrating data into one document in a systematic sequence. CONSTITUTION: A training module(102) classifies property of a webpage having specific information and property of a webpage not having specific information through a Bayes theorem. The training module learns probability which refers whether the feature is on a web page. A data dictionary constructing module(104) constructs an ontology data dictionary for supporting search of high accuracy.
Abstract translation: 目的:提供网页的异构数据融合/供应系统及其方法,以便以系统顺序将数据集成到一个文档中,为用户提供方便的搜索结果。 规定:培训模块(102)通过贝叶斯定理对具有特定信息和不具有特定信息的网页的属性进行分类。 培训模块学习概述是否该功能在网页上。 数据字典构造模块(104)构建用于支持高精度搜索的本体数据字典。
-