-
公开(公告)号:KR100800460B1
公开(公告)日:2008-02-04
申请号:KR1020060066759
申请日:2006-07-18
Applicant: 제주대학교 산학협력단
Abstract: 본 발명은 웹 온톨로지 검색/분류 시스템 및 그 방법에 대한 것으로서, 웹 데이터를 읽어들여 HTML로 구성된 웹페이지 구문을 분석하고 OWL 또는 RDF로 된 웹 온톨로지 파일을 수집하는 웹 페이지 크롤러, 수집된 온톨로지의 도메인을 파악하고 도메인과 온톨로지의 내용에 기반하여 분류하는 온톨로지 분류모듈, 상기 온톨로지 각각에 대한 내용에 의거하여 우선순위를 부여하고, 상기 부여된 순위와 온톨로지 도메인을 이용하여 온톨로지 분류를 위한 색인 온톨로지를 구축하는 랭킹 모듈, 및 상기 분류된 온톨로지와 부여된 랭킹에 따라 사용자의 질의에 해당하는 온톨로지 결과를 사용자에게 제공하는 온톨로지 검색모듈을 포함하며, 웹 온톨로지의 재사용성을 위해 웹의 곳곳에 산재되어 있는 온톨로지를 검색하고 분류하여, 온톨로지를 구축하고자 하는 경우에는 기존 작성된 온톨로지를 최대한 이용할 수 있게 된다.
온톨로지, HTML 파서, 온톨로지 파서, 랭킹 모듈, 색인 온톨로지-
公开(公告)号:KR1020080007740A
公开(公告)日:2008-01-23
申请号:KR1020060066759
申请日:2006-07-18
Applicant: 제주대학교 산학협력단
CPC classification number: G06F17/30705 , G06F17/30861
Abstract: A system and a method for retrieving/dividing web ontology are provided to enable a user to reuse the web ontology efficiently by retrieving/dividing the web ontology, and offer the most suitable ontology to the user by checking a correct domain for contents of the ontology and evaluating perfection of the contents of each ontology. A webpage crawler(10) collects OWL(Web Ontology Language) or RDF(Resource Description File) web ontology files by reading web data and parsing webpage syntax made of HTML(HyperText Markup Language). An ontology dividing module(20) divides the collected web ontology files based on domain and ontology contents by checking the domain of the collected ontology. A ranking module(30) constructs index ontology for dividing the ontology by assigning priority to each ontology based on the ontology contents and using the assigned priority. An ontology retrieving module(40) provides an ontology result corresponding to a user query to a user according to the divided ontology and the assigned ranking. A storing module(50) stores the index ontology constructed according to the domain and the ranking.
Abstract translation: 提供了用于检索/分割网络本体的系统和方法,以使用户能够通过检索/分割网络本体来有效地重用网页本体,并且通过为本体的内容检查正确的域来向用户提供最合适的本体 并评估每个本体内容的完美性。 网页抓取工具(10)通过阅读Web数据和解析由HTML(HyperText Markup Language)构成的网页语法来收集OWL(Web本体语言)或RDF(资源描述文件)网络本体文件。 本体分割模块(20)通过检查收集的本体的领域来分割基于域和本体内容的收集的web本体文件。 排序模块(30)通过基于本体内容并使用分配的优先级为每个本体分配优先级来构建用于划分本体的索引本体。 本体检索模块(40)根据分割本体和分配的排名向用户提供与用户查询对应的本体结果。 存储模块(50)存储根据域和排名构造的索引本体。
-