Abstract:
The present invention relates to an apparatus for automatically learning documents and a method for automatically learning documents using the same, and an apparatus for automatically classifying documents and a method for automatically classifying documents using the same, which are capable of automatically learning and classifying mass documents on the web through a process of automatically learning and classifying documents based on n-gram. The apparatus for automatically classifying documents according to the present invention includes: a learning document pool including a plurality of learning document groups which are classified according to categories; a preprocessing unit configured to preprocess each of the learning document groups of the learning document pool; and an n-gram data set pool configured to store a set of n-gram data of the learning document pool, which is formed by being learned through the preprocessing of the preprocessing unit. Additionally, the apparatus for automatically classifying documents includes: an automatic document learning unit configured to allow the preprocessing unit to preprocess a corresponding new document to form a bigram set, when the new document occurs, which is not identified through the learning document pool; and an automatic document classifying unit configured to compare the bigram set of the new document, formed through the preprocessing unit, with a bigram set of the n-gram data set pool and to allocate and store the bigram set of the new document to one of n-gram data sets of the n-gram data set pool. [Reference numerals] (220) Automatic document classifying unit; (230) Learned n-gram data set(bigram example); (AA) Non-identified document; (BB) Appearance of a new document; (CC) Preprocessing
Abstract:
본 발명은 중소기업형 RFID 미들웨어 플랫폼에 관한 것으로, 리더기 등의 장비를 관리하거나, 이기종 RFID 환경에서 발생하는 대량의 데이터를 수집, 필터링하여 의미 있는 정보로 변환하여 응용 소프트웨어 등에 필요한 정보를 제공하는 RFID 미들웨어를 포함한다. 본 발명의 RFID 미들웨어는 한쪽 끝은 리더 등과 같은 하드웨어와 인터페이스하고, 다른 한쪽 끝은 기업용 솔루션과 같은 산업용 응용 소프트 웨어와 연계하여 기업이나 산업현장에 분산되어 설치되는 장치들의 복잡도를 효과적으로 관리할 수 있다. RFID, RFID 미들웨어, 태그, 리더
Abstract:
A web based image reuse system and a method are provided to reduce that the cost in the manufacture and the labor and time by reusing the photography and the images which are already manufactured, while a user directly does not take a picture of necessary images in a moving picture production. A web based image reuse system comprises: a user authentication server(310) for controlling the access of a user through an authentication of a user access apparatus(210); a query processing server(320) for matching the images which coincide with a multimedia server(330) by analyzing a query language delivered through a connecting apparatus; and a multimedia server for storing images uploaded from a plurality of users through the connecting apparatus.
Abstract:
본 발명은 가상키보드를 이용하여 문자를 입력하고, 입력된 문자를 바탕으로 선정된 추천단어가 표시되며, 표시된 추천단어를 선택할 수 있는 터치스크린부와, 상기 입력된 문자를 바탕으로 비교대상이 되는 엔-그램 데이터를 추출하고 출현 빈도수가 높은 순으로 추천단어를 선정하여 터치스크린부로 출력하는 추천단어 추출부와, 상기 추천단어 추출부와 연결되어 엔-그램 데이터를 제공하고, 정제된 특정 도메인으로부터 엔-그램을 추출하여 엔-그램 데이터베이스를 구축하는 엔-그램 DB 구축부를 포함하는 것을 특징으로 하는 터치스크린 환경에서 단어 추천 및 문장 완성 시스템 및 그 방법을 제공한다. 본 발명의 터치스크린 환경에서 단어 추천 및 문장 완성 시스템 및 그 방법에 따르면, 신뢰성 높은 웹문서에서 특정 도메인만을 선정하여 구축된 엔-그램 데이터를 바탕으로 사용자가 입력하는 단어의 순번과 해당 음절에 부합하는 엔-그램 데이터를 선정하고, 출현빈도 수가 높은 단어 즉, 빈번히 사용하는 단어 순으로 추천단어를 출력하며, 사용자의 의도와 일치하는 추천단어를 선택하도록 함으로써, 최소한의 키입력으로 정확한 단어를 입력하고 문장을 쉽게 완성시킬 수 있다.
Abstract:
사용자가 입력한 질의어와 가장 유사한 이미지를 찾아주기 위하여 이미지 데이터에서 키워드를 추출하고, 워드넷을 이용하여 키워드간 유사도를 측정하며, 측정한 유사도를 이용하여 이미지 우선순위를 분석하여 의미가 질의어와 가장 가까운 이미지를 찾아주는 방법 유사도, 이미지 검색, 의미량, 워드넷
Abstract:
국내문서의 효율적이고 의미적인 분류를 위하여 의미사전을 이용하여 문서내 명사를 추출하며, 추출한 개념의 빈도값(TF: Term Frequency)과 주변 개념들과의 관계된 정도(RV: Relation Value)를 측정하고, 추출된 키워드들을 의미사전과 매핑하여 핵심 키워드 그룹 파악하고, 개념가중치를 구하여 의미사전에 매핑하는 과정을 통하여 의미적인 문서 분류 방법 주제선정, 핵심키워드그룹, 자동분류, 의미사전