Abstract:
본 발명은 웹 온톨로지 검색/분류 시스템 및 그 방법에 대한 것으로서, 웹 데이터를 읽어들여 HTML로 구성된 웹페이지 구문을 분석하고 OWL 또는 RDF로 된 웹 온톨로지 파일을 수집하는 웹 페이지 크롤러, 수집된 온톨로지의 도메인을 파악하고 도메인과 온톨로지의 내용에 기반하여 분류하는 온톨로지 분류모듈, 상기 온톨로지 각각에 대한 내용에 의거하여 우선순위를 부여하고, 상기 부여된 순위와 온톨로지 도메인을 이용하여 온톨로지 분류를 위한 색인 온톨로지를 구축하는 랭킹 모듈, 및 상기 분류된 온톨로지와 부여된 랭킹에 따라 사용자의 질의에 해당하는 온톨로지 결과를 사용자에게 제공하는 온톨로지 검색모듈을 포함하며, 웹 온톨로지의 재사용성을 위해 웹의 곳곳에 산재되어 있는 온톨로지를 검색하고 분류하여, 온톨로지를 구축하고자 하는 경우에는 기존 작성된 온톨로지를 최대한 이용할 수 있게 된다. 온톨로지, HTML 파서, 온톨로지 파서, 랭킹 모듈, 색인 온톨로지
Abstract:
A system and a method for retrieving/dividing web ontology are provided to enable a user to reuse the web ontology efficiently by retrieving/dividing the web ontology, and offer the most suitable ontology to the user by checking a correct domain for contents of the ontology and evaluating perfection of the contents of each ontology. A webpage crawler(10) collects OWL(Web Ontology Language) or RDF(Resource Description File) web ontology files by reading web data and parsing webpage syntax made of HTML(HyperText Markup Language). An ontology dividing module(20) divides the collected web ontology files based on domain and ontology contents by checking the domain of the collected ontology. A ranking module(30) constructs index ontology for dividing the ontology by assigning priority to each ontology based on the ontology contents and using the assigned priority. An ontology retrieving module(40) provides an ontology result corresponding to a user query to a user according to the divided ontology and the assigned ranking. A storing module(50) stores the index ontology constructed according to the domain and the ranking.
Abstract:
The present invention relates to an apparatus for automatically learning documents and a method for automatically learning documents using the same, and an apparatus for automatically classifying documents and a method for automatically classifying documents using the same, which are capable of automatically learning and classifying mass documents on the web through a process of automatically learning and classifying documents based on n-gram. The apparatus for automatically classifying documents according to the present invention includes: a learning document pool including a plurality of learning document groups which are classified according to categories; a preprocessing unit configured to preprocess each of the learning document groups of the learning document pool; and an n-gram data set pool configured to store a set of n-gram data of the learning document pool, which is formed by being learned through the preprocessing of the preprocessing unit. Additionally, the apparatus for automatically classifying documents includes: an automatic document learning unit configured to allow the preprocessing unit to preprocess a corresponding new document to form a bigram set, when the new document occurs, which is not identified through the learning document pool; and an automatic document classifying unit configured to compare the bigram set of the new document, formed through the preprocessing unit, with a bigram set of the n-gram data set pool and to allocate and store the bigram set of the new document to one of n-gram data sets of the n-gram data set pool. [Reference numerals] (220) Automatic document classifying unit; (230) Learned n-gram data set(bigram example); (AA) Non-identified document; (BB) Appearance of a new document; (CC) Preprocessing
Abstract:
본 발명은 중소기업형 RFID 미들웨어 플랫폼에 관한 것으로, 리더기 등의 장비를 관리하거나, 이기종 RFID 환경에서 발생하는 대량의 데이터를 수집, 필터링하여 의미 있는 정보로 변환하여 응용 소프트웨어 등에 필요한 정보를 제공하는 RFID 미들웨어를 포함한다. 본 발명의 RFID 미들웨어는 한쪽 끝은 리더 등과 같은 하드웨어와 인터페이스하고, 다른 한쪽 끝은 기업용 솔루션과 같은 산업용 응용 소프트 웨어와 연계하여 기업이나 산업현장에 분산되어 설치되는 장치들의 복잡도를 효과적으로 관리할 수 있다. RFID, RFID 미들웨어, 태그, 리더
Abstract:
A web based image reuse system and a method are provided to reduce that the cost in the manufacture and the labor and time by reusing the photography and the images which are already manufactured, while a user directly does not take a picture of necessary images in a moving picture production. A web based image reuse system comprises: a user authentication server(310) for controlling the access of a user through an authentication of a user access apparatus(210); a query processing server(320) for matching the images which coincide with a multimedia server(330) by analyzing a query language delivered through a connecting apparatus; and a multimedia server for storing images uploaded from a plurality of users through the connecting apparatus.
Abstract:
본 발명은 가상키보드를 이용하여 문자를 입력하고, 입력된 문자를 바탕으로 선정된 추천단어가 표시되며, 표시된 추천단어를 선택할 수 있는 터치스크린부와, 상기 입력된 문자를 바탕으로 비교대상이 되는 엔-그램 데이터를 추출하고 출현 빈도수가 높은 순으로 추천단어를 선정하여 터치스크린부로 출력하는 추천단어 추출부와, 상기 추천단어 추출부와 연결되어 엔-그램 데이터를 제공하고, 정제된 특정 도메인으로부터 엔-그램을 추출하여 엔-그램 데이터베이스를 구축하는 엔-그램 DB 구축부를 포함하는 것을 특징으로 하는 터치스크린 환경에서 단어 추천 및 문장 완성 시스템 및 그 방법을 제공한다. 본 발명의 터치스크린 환경에서 단어 추천 및 문장 완성 시스템 및 그 방법에 따르면, 신뢰성 높은 웹문서에서 특정 도메인만을 선정하여 구축된 엔-그램 데이터를 바탕으로 사용자가 입력하는 단어의 순번과 해당 음절에 부합하는 엔-그램 데이터를 선정하고, 출현빈도 수가 높은 단어 즉, 빈번히 사용하는 단어 순으로 추천단어를 출력하며, 사용자의 의도와 일치하는 추천단어를 선택하도록 함으로써, 최소한의 키입력으로 정확한 단어를 입력하고 문장을 쉽게 완성시킬 수 있다.