Abstract:
The present invention relates to an apparatus for automatically learning documents and a method for automatically learning documents using the same, and an apparatus for automatically classifying documents and a method for automatically classifying documents using the same, which are capable of automatically learning and classifying mass documents on the web through a process of automatically learning and classifying documents based on n-gram. The apparatus for automatically classifying documents according to the present invention includes: a learning document pool including a plurality of learning document groups which are classified according to categories; a preprocessing unit configured to preprocess each of the learning document groups of the learning document pool; and an n-gram data set pool configured to store a set of n-gram data of the learning document pool, which is formed by being learned through the preprocessing of the preprocessing unit. Additionally, the apparatus for automatically classifying documents includes: an automatic document learning unit configured to allow the preprocessing unit to preprocess a corresponding new document to form a bigram set, when the new document occurs, which is not identified through the learning document pool; and an automatic document classifying unit configured to compare the bigram set of the new document, formed through the preprocessing unit, with a bigram set of the n-gram data set pool and to allocate and store the bigram set of the new document to one of n-gram data sets of the n-gram data set pool. [Reference numerals] (220) Automatic document classifying unit; (230) Learned n-gram data set(bigram example); (AA) Non-identified document; (BB) Appearance of a new document; (CC) Preprocessing
Abstract:
본 발명은 엔그램 기반의 문서 자동 학습 및 분류 과정을 통해 웹상의 대용량 문서들을 자동으로 학습 및 분류할 수 있도록 하는 문서의 자동 학습 장치와 이를 이용한 문서 자동 학습 방법, 문서의 자동 분류 장치와 이를 이용한 문서 자동 분류 방법에 관한 것으로서, 본 발명에 따른 문서의 자동 분류 장치는 카테고리 별로 분류된 복수의 학습문서 그룹이 포함되는 학습문서 풀과, 상기 학습문서 풀의 각 학습문서 그룹에 대해 전처리 과정을 하는 전처리부와, 상기 전처리부의 전처리 과정을 통해 학습되어 형성된 상기 학습문서 풀의 엔그램 데이터 세트가 저장되는 엔그램 데이터 세트 풀을 포함하며, 상기 학습문서 풀을 통해 식별되지 않는 신규 문서 출현 시 상기 전처리부가 해당 신규문서를 전처리하여 바이그램 세트를 형성하는 문서 자동 학습부와, 상기 전처리부를 통해 형성되는 상기 신규문서의 바이그램 세트와 상기 엔그램 데이터 세트 풀의 바이그램 세트를 비교하여 상기 신규문서의 바이그램 세트를 상기 엔그램 데이터 세트 풀 중 어느 하나의 엔그램 데이터 세트에 할당하여 저장하는 문서 자동 분류부를 포함하여 형성된다.
Abstract:
본 발명은 번역할 단어 입력 및 추천 대역어에 관한 정보를 표시하는 디스플레이부와, 대역어 대상이 되는 언어의 특정 도메인 대용량 문서를 분석하여 대역어 후보 단어를 추출하고, 그 후보 단어의 빈도수와 가중치를 계산한 뒤, 기 설정된 임계값 이상인 데이터들만 선정하여 대역어 데이터베이스를 구축하는 대역어 데이터 베이스부와, 상기 디스플레이부에 입력된 단어를 바탕으로 기존 대역어 사전을 검색하여 후보 대역어를 추출하고, 상기 대역어 데이터베이스부에 구축된 후보 대역어의 빈도수와 가중치를 비교하여 빈도수와 가중치가 높은 대역어 순으로 디스플레이부에 출력하는 추천 대역어 결정부를 포함하여 구성된 것을 특징으로 하는 도메인 대역어 추천 시스템 및 그 방법을 제공한다. 본 발명의 도메인 대역어 추천 시스템 및 그 방법에 따르면, 입력된 단어를 바탕으로 기존 대역어 사전에서 검색하여 후보 대역어를 추출하고, 기 구축된 대역어 데이터베이스에서 갖는 후보 대역어의 빈도수와 가중치를 비교하여 가장 빈번히 사용되고 있는 의미적, 문맥적으로 합당한 대역어를 사용자에게 예문과 함께 제공함으로써 영어 또는 해당 언어의 작문 시 빈번히 발생하는 동사, 명사 선정의 실수와 오류를 최소화할 수 있다.
Abstract:
PURPOSE: A domain target word recommendation system and a method thereof are provided to minimize the error and mistake of verb and noun selection by providing the example of a target word. CONSTITUTION: A display unit (100) inputs a searching command for translating target words and target words. A target word database (DB) unit (200) extracts a target word candidate word in a specific domain massive amount document and constructs a target word DB by calculating the weighted value and the frequency of the target word candidate word. A recommended target word determination unit (300) receives a target word searching signal, extracts a recommended target word, compares the frequency of the recommended target word with the weighted value, selects the recommended target word, and outputs information related to the selected recommended target word to the display unit. [Reference numerals] (100) Display unit; (112) Word input unit; (114) Implementation button unit; (116) Output unit; (200) Target word database (DB) unit; (300) Recommended target word determination unit; (312) Candidate target word determination unit; (314) Comparing unit; (316) Recommended target word selecting unit; (320) Existing target word dictionary unit
Abstract:
본 발명은 사용자맞춤형 커피제조를 위한 스마트 디바이스 기반의 커피 자판기 시스템 및 이를 이용한 커피제조 방법에 관한 것으로, 사용자에게서 커피의 재료 양을 입력받은 커피재료정보가 담긴 QR코드를 생성하는 커피제조 어플리케이션과 상기 커피제조 어플리케이션이 구동 가능한 스마트 디바이스와 상기 QR코드를 QR코드 리더기로 인식하고, 상기 QR코드 리더기는 제어부로 QR코드를 전달하여 커피재료정보를 분석하고, 상기 제어부가 커피재료정보를 커피재료조절부에 전달하여 커피를 추출하는 QR코드 자판기로 구성된 것을 특징으로 한다. 따라서 사용자들이 스마트 디바이스와 연계된 커피제조 어플리케이션을 이용하여 커피의 재료를 조절하면, 커피재료정보를 받은 커피제조 어플리케이션이 QR코드를 생성하고, QR코드 자판기의 QR코드 리더기에 생성된 QR코드를 인식만 시켜주면 되기 때문에 조작이 간편하고, 사용자의 기호에 맞는 커피를 제공할 수 있다. 또한, 본 발명에 따른 사용자맞춤형 커피제조를 위한 스마트 디바이스 기반의 커피 자판기 시스템 및 이를 이용한 커피제조 방법은, 커피 제조를 위한 인건비와 유지비 절감으로 저렴하며, 자판기의 형태이기 때문에 접근성이 뛰어나다.