Abstract:
본 발명은 엔그램 기반의 문서 자동 학습 및 분류 과정을 통해 웹상의 대용량 문서들을 자동으로 학습 및 분류할 수 있도록 하는 문서의 자동 학습 장치와 이를 이용한 문서 자동 학습 방법, 문서의 자동 분류 장치와 이를 이용한 문서 자동 분류 방법에 관한 것으로서, 본 발명에 따른 문서의 자동 분류 장치는 카테고리 별로 분류된 복수의 학습문서 그룹이 포함되는 학습문서 풀과, 상기 학습문서 풀의 각 학습문서 그룹에 대해 전처리 과정을 하는 전처리부와, 상기 전처리부의 전처리 과정을 통해 학습되어 형성된 상기 학습문서 풀의 엔그램 데이터 세트가 저장되는 엔그램 데이터 세트 풀을 포함하며, 상기 학습문서 풀을 통해 식별되지 않는 신규 문서 출현 시 상기 전처리부가 해당 신규문서를 전처리하여 바이그램 세트를 형성하는 문서 자동 학습부와, 상기 전처리부를 통해 형성되는 상기 신규문서의 바이그램 세트와 상기 엔그램 데이터 세트 풀의 바이그램 세트를 비교하여 상기 신규문서의 바이그램 세트를 상기 엔그램 데이터 세트 풀 중 어느 하나의 엔그램 데이터 세트에 할당하여 저장하는 문서 자동 분류부를 포함하여 형성된다.
Abstract:
본 발명은 번역할 단어 입력 및 추천 대역어에 관한 정보를 표시하는 디스플레이부와, 대역어 대상이 되는 언어의 특정 도메인 대용량 문서를 분석하여 대역어 후보 단어를 추출하고, 그 후보 단어의 빈도수와 가중치를 계산한 뒤, 기 설정된 임계값 이상인 데이터들만 선정하여 대역어 데이터베이스를 구축하는 대역어 데이터 베이스부와, 상기 디스플레이부에 입력된 단어를 바탕으로 기존 대역어 사전을 검색하여 후보 대역어를 추출하고, 상기 대역어 데이터베이스부에 구축된 후보 대역어의 빈도수와 가중치를 비교하여 빈도수와 가중치가 높은 대역어 순으로 디스플레이부에 출력하는 추천 대역어 결정부를 포함하여 구성된 것을 특징으로 하는 도메인 대역어 추천 시스템 및 그 방법을 제공한다. 본 발명의 도메인 대역어 추천 시스템 및 그 방법에 따르면, 입력된 단어를 바탕으로 기존 대역어 사전에서 검색하여 후보 대역어를 추출하고, 기 구축된 대역어 데이터베이스에서 갖는 후보 대역어의 빈도수와 가중치를 비교하여 가장 빈번히 사용되고 있는 의미적, 문맥적으로 합당한 대역어를 사용자에게 예문과 함께 제공함으로써 영어 또는 해당 언어의 작문 시 빈번히 발생하는 동사, 명사 선정의 실수와 오류를 최소화할 수 있다.
Abstract:
PURPOSE: A domain target word recommendation system and a method thereof are provided to minimize the error and mistake of verb and noun selection by providing the example of a target word. CONSTITUTION: A display unit (100) inputs a searching command for translating target words and target words. A target word database (DB) unit (200) extracts a target word candidate word in a specific domain massive amount document and constructs a target word DB by calculating the weighted value and the frequency of the target word candidate word. A recommended target word determination unit (300) receives a target word searching signal, extracts a recommended target word, compares the frequency of the recommended target word with the weighted value, selects the recommended target word, and outputs information related to the selected recommended target word to the display unit. [Reference numerals] (100) Display unit; (112) Word input unit; (114) Implementation button unit; (116) Output unit; (200) Target word database (DB) unit; (300) Recommended target word determination unit; (312) Candidate target word determination unit; (314) Comparing unit; (316) Recommended target word selecting unit; (320) Existing target word dictionary unit
Abstract:
PURPOSE: A word recommendation and sentence completion system in a touch screen environment and a method thereof are provided to reduce the input time of characters by reducing the occurrence of typing errors. CONSTITUTION: A touch screen unit (100) inputs characters by using virtual keyboards and displays recommended characters based on the inputted characters. A recommended word extraction unit (200) extracts engram data based on the inputted character and outputs the extracted data to the touch screen unit. An engram database (DB) construction unit constructs an engram DB (300) by extracting the engram from a specific domain by connecting to the recommended word extraction unit. [Reference numerals] (110) Text input unit; (120) Recommended word output unit; (130) Input word and a recommended word output unit; (210) Comparative N-gram output unit; (220) Recommended word selecting unit; (300) Comparative N-gram database
Abstract:
A system and a method for browsing information based on ontology are provided to offer information efficiently up to attribute concepts used for defining a keyword, and upper, lower, synonym, and anonym concepts related to the keyword by browsing the searched information based on an ontology graph model. An ontology server(310) includes definitions for tangible/intangible concepts by using ontology description language. A browsing service server(340) includes an ontology analyzer(341) extracting a triple by analyzing ontology of the ontology server, an ontology inferrer(342) inferring a new fact based on the analyzed tripe, a query matcher(344) extracting the concepts related to a query by matching the query received from a user with the ontology, a graph structure representer(343) moving the concepts and reforming a graph based on the query by converting the extracted triples into the graph, and a search result processor(345) moving and reforming the graph when the user selects the concept in the graph. A web information analysis server(330) includes a web document analyzer(331) and a new concept/attribute processor(332). An ontology management server(320) includes an ontology updater(322) and an integrated ontology manager(321).