문서의 자동 학습 장치와 이를 이용한 문서 자동 학습 방법, 문서의 자동 분류 장치와 이를 이용한 문서 자동 분류 방법
    1.
    发明公开
    문서의 자동 학습 장치와 이를 이용한 문서 자동 학습 방법, 문서의 자동 분류 장치와 이를 이용한 문서 자동 분류 방법 有权
    用于基于N-GRAM统计的培训和分类文档的自动设备和用于根据其N-GRAM统计量进行培训和分类文档的自动方法

    公开(公告)号:KR1020140049659A

    公开(公告)日:2014-04-28

    申请号:KR1020120115730

    申请日:2012-10-18

    CPC classification number: G06F17/21 G06F17/10 G06F17/2755

    Abstract: The present invention relates to an apparatus for automatically learning documents and a method for automatically learning documents using the same, and an apparatus for automatically classifying documents and a method for automatically classifying documents using the same, which are capable of automatically learning and classifying mass documents on the web through a process of automatically learning and classifying documents based on n-gram. The apparatus for automatically classifying documents according to the present invention includes: a learning document pool including a plurality of learning document groups which are classified according to categories; a preprocessing unit configured to preprocess each of the learning document groups of the learning document pool; and an n-gram data set pool configured to store a set of n-gram data of the learning document pool, which is formed by being learned through the preprocessing of the preprocessing unit. Additionally, the apparatus for automatically classifying documents includes: an automatic document learning unit configured to allow the preprocessing unit to preprocess a corresponding new document to form a bigram set, when the new document occurs, which is not identified through the learning document pool; and an automatic document classifying unit configured to compare the bigram set of the new document, formed through the preprocessing unit, with a bigram set of the n-gram data set pool and to allocate and store the bigram set of the new document to one of n-gram data sets of the n-gram data set pool. [Reference numerals] (220) Automatic document classifying unit; (230) Learned n-gram data set(bigram example); (AA) Non-identified document; (BB) Appearance of a new document; (CC) Preprocessing

    Abstract translation: 本发明涉及一种用于自动学习文档的装置和一种使用该装置自动学习文档的方法,以及一种用于自动分类文档的装置和一种使用该文档自动分类文档的方法,其能够自动学习和分类大量文档 在网络上通过自动学习和分类基于n-gram的文档的过程。 根据本发明的用于自动分类文档的装置包括:包括根据类别分类的多个学习文档组的学习文档库; 预处理单元,被配置为预处理学习文档池的每个学习文档组; 以及被配置为存储通过预处理单元的预处理而学习形成的学习文档池的一组n-gram数据的n元数据集池。 另外,用于自动分类文档的装置包括:自动文档学习单元,被配置为当新文档发生时,允许预处理单元预处理对应的新文档以形成双标集,其不通过学习文档池被识别; 以及自动文件分类单元,被配置为将通过预处理单元形成的新文档的二进制组与n-gram数据集池的二进制组进行比较,并将新文档的二进制组分配并存储到 n-gram数据集的n-gram数据集。 (附图标记)(220)自动文件分类单元; (230)学习的n-gram数据集(bigram示例); (AA)未确定文件; (BB)新文件的出现; (CC)预处理

    터치스크린 환경에서 단어 추천 및 문장 완성 방법
    2.
    发明授权
    터치스크린 환경에서 단어 추천 및 문장 완성 방법 有权
    触摸屏设备推荐单词和完成句子的方法

    公开(公告)号:KR101355284B1

    公开(公告)日:2014-01-28

    申请号:KR1020120019525

    申请日:2012-02-27

    Abstract: 본 발명은 가상키보드를 이용하여 문자를 입력하고, 입력된 문자를 바탕으로 선정된 추천단어가 표시되며, 표시된 추천단어를 선택할 수 있는 터치스크린부와, 상기 입력된 문자를 바탕으로 비교대상이 되는 엔-그램 데이터를 추출하고 출현 빈도수가 높은 순으로 추천단어를 선정하여 터치스크린부로 출력하는 추천단어 추출부와, 상기 추천단어 추출부와 연결되어 엔-그램 데이터를 제공하고, 정제된 특정 도메인으로부터 엔-그램을 추출하여 엔-그램 데이터베이스를 구축하는 엔-그램 DB 구축부를 포함하는 것을 특징으로 하는 터치스크린 환경에서 단어 추천 및 문장 완성 시스템 및 그 방법을 제공한다.
    본 발명의 터치스크린 환경에서 단어 추천 및 문장 완성 시스템 및 그 방법에 따르면, 신뢰성 높은 웹문서에서 특정 도메인만을 선정하여 구축된 엔-그램 데이터를 바탕으로 사용자가 입력하는 단어의 순번과 해당 음절에 부합하는 엔-그램 데이터를 선정하고, 출현빈도 수가 높은 단어 즉, 빈번히 사용하는 단어 순으로 추천단어를 출력하며, 사용자의 의도와 일치하는 추천단어를 선택하도록 함으로써, 최소한의 키입력으로 정확한 단어를 입력하고 문장을 쉽게 완성시킬 수 있다.

    소셜 정보 기반의 앨범 제작 시스템 및 그 방법
    3.
    发明公开
    소셜 정보 기반의 앨범 제작 시스템 및 그 방법 有权
    基于WEB服务处理社会信息的生成系统和方法

    公开(公告)号:KR1020140115413A

    公开(公告)日:2014-10-01

    申请号:KR1020130028711

    申请日:2013-03-18

    CPC classification number: G06Q50/01 G06Q50/10 G06Q50/30

    Abstract: The present invention relates to a system for creating a social information-based album and a method thereof, capable of creating a customized album online based on social network services which are very actively used recently and social information items with diversity such as photo images, text, comments, and the like, provided through the social network services, and allowing a corresponding user to possess the album online or offline as needed. The system for creating a social information-based album according to the present invention comprises a social network service (SNS) server operating an SNS, an album creating server connected to the SNS server through a communications network, receiving social information from a database server associated with each SNS server, and editing the received social information to create an album, and a user terminal connected to the album creating server via the communications network and designating information desired to be included in the album among social information items stored in the database server of the SNS server.

    Abstract translation: 本发明涉及一种用于创建基于社交信息的相册的系统及其方法,其能够基于最近非常积极地使用的社交网络服务在线创建定制的专辑,并且具有多样性的社交信息项目,例如照片图像,文本 ,评论等,通过社交网络服务提供,并允许相应的用户根据需要在线或离线拥有相册。 根据本发明的用于创建基于社交信息的相册的系统包括操作SNS的社交网络服务(SNS)服务器,通过通信网络连接到SNS服务器的相册创建服务器,从与数据库服务器相关联的社交信息接收 与每个SNS服务器一起编辑接收到的社交信息以创建相册,以及通过通信网络连接到相册创建服务器的用户终端,并且将存储在数据库服务器中的社交信息项中指定期望包括在相册中的信息指定 SNS服务器。

    소셜 정보 기반의 앨범 제작 시스템 및 그 방법
    4.
    发明授权
    소셜 정보 기반의 앨범 제작 시스템 및 그 방법 有权
    基于处理社交信息的Web服务生成相册的系统和方法

    公开(公告)号:KR101468294B1

    公开(公告)日:2014-12-03

    申请号:KR1020130028711

    申请日:2013-03-18

    Abstract: 본발명은최근들어매우활발히이용되고있는소셜네트워크서비스및 그를통해제공되는사진, 텍스트, 댓글등 다양성이있는소셜정보들을기반으로온라인상에서사용자맞춤형앨범을제작후 이를해당사용자가온라인상에서소장하거나필요에따라오프라인상의앨범형태로소장할수 있도록하는소셜정보기반의앨범제작시스템및 그방법에관한것으로서, 본발명에따른소셜정보기반의앨범제작시스템은소셜네트워크서비스(SNS : Socil Network Service)를운영하는 SNS 서버와, 상기 SNS 서버와통신망을통해접속되어각 SNS 서버의연계된데이터베이스서버로부터소셜정보들을제공받아이를편집해앨범을제작하는앨범제작서버와, 상기앨범제작서버에통신망을통해접속되어상기 SNS 서버의데이터베이스서버에저장된소셜정보중 앨범에포함을원하는정보를지정하는사용자단말기를포함하여구성된다.

    문서의 자동 학습 장치와 이를 이용한 문서 자동 학습 방법, 문서의 자동 분류 장치와 이를 이용한 문서 자동 분류 방법
    5.
    发明授权
    문서의 자동 학습 장치와 이를 이용한 문서 자동 학습 방법, 문서의 자동 분류 장치와 이를 이용한 문서 자동 분류 방법 有权
    一种基于N-gram统计的用于对文档进行训练和分类的自动装置,以及基于N-gram统计的用于对文档进行训练和分类的自动方法

    公开(公告)号:KR101400548B1

    公开(公告)日:2014-05-27

    申请号:KR1020120115730

    申请日:2012-10-18

    Abstract: 본 발명은 엔그램 기반의 문서 자동 학습 및 분류 과정을 통해 웹상의 대용량 문서들을 자동으로 학습 및 분류할 수 있도록 하는 문서의 자동 학습 장치와 이를 이용한 문서 자동 학습 방법, 문서의 자동 분류 장치와 이를 이용한 문서 자동 분류 방법에 관한 것으로서, 본 발명에 따른 문서의 자동 분류 장치는 카테고리 별로 분류된 복수의 학습문서 그룹이 포함되는 학습문서 풀과, 상기 학습문서 풀의 각 학습문서 그룹에 대해 전처리 과정을 하는 전처리부와, 상기 전처리부의 전처리 과정을 통해 학습되어 형성된 상기 학습문서 풀의 엔그램 데이터 세트가 저장되는 엔그램 데이터 세트 풀을 포함하며, 상기 학습문서 풀을 통해 식별되지 않는 신규 문서 출현 시 상기 전처리부가 해당 신규문서를 전처리하여 바이그램 세트를 형성하는 문서 자동 학습부와, 상기 전처리부를 통해 형성되는 상기 신규문서의 바이그램 세트와 상기 엔그램 데이터 세트 풀의 바이그램 세트를 비교하여 상기 신규문서의 바이그램 세트를 상기 엔그램 데이터 세트 풀 중 어느 하나의 엔그램 데이터 세트에 할당하여 저장하는 문서 자동 분류부를 포함하여 형성된다.

    도메인 대역어 추천 시스템 및 그 방법
    6.
    发明授权
    도메인 대역어 추천 시스템 및 그 방법 有权
    推荐特定域名替代词的系统和方法

    公开(公告)号:KR101335144B1

    公开(公告)日:2013-12-05

    申请号:KR1020120019527

    申请日:2012-02-27

    Abstract: 본 발명은 번역할 단어 입력 및 추천 대역어에 관한 정보를 표시하는 디스플레이부와, 대역어 대상이 되는 언어의 특정 도메인 대용량 문서를 분석하여 대역어 후보 단어를 추출하고, 그 후보 단어의 빈도수와 가중치를 계산한 뒤, 기 설정된 임계값 이상인 데이터들만 선정하여 대역어 데이터베이스를 구축하는 대역어 데이터 베이스부와, 상기 디스플레이부에 입력된 단어를 바탕으로 기존 대역어 사전을 검색하여 후보 대역어를 추출하고, 상기 대역어 데이터베이스부에 구축된 후보 대역어의 빈도수와 가중치를 비교하여 빈도수와 가중치가 높은 대역어 순으로 디스플레이부에 출력하는 추천 대역어 결정부를 포함하여 구성된 것을 특징으로 하는 도메인 대역어 추천 시스템 및 그 방법을 제공한다.
    본 발명의 도메인 대역어 추천 시스템 및 그 방법에 따르면, 입력된 단어를 바탕으로 기존 대역어 사전에서 검색하여 후보 대역어를 추출하고, 기 구축된 대역어 데이터베이스에서 갖는 후보 대역어의 빈도수와 가중치를 비교하여 가장 빈번히 사용되고 있는 의미적, 문맥적으로 합당한 대역어를 사용자에게 예문과 함께 제공함으로써 영어 또는 해당 언어의 작문 시 빈번히 발생하는 동사, 명사 선정의 실수와 오류를 최소화할 수 있다.

    도메인 대역어 추천 시스템 및 그 방법
    7.
    发明公开
    도메인 대역어 추천 시스템 및 그 방법 有权
    用于建议特定领域替代词的系统和方法

    公开(公告)号:KR1020130097890A

    公开(公告)日:2013-09-04

    申请号:KR1020120019527

    申请日:2012-02-27

    CPC classification number: G06F17/2818 G06F17/277 G06F17/2785 G06F17/30684

    Abstract: PURPOSE: A domain target word recommendation system and a method thereof are provided to minimize the error and mistake of verb and noun selection by providing the example of a target word. CONSTITUTION: A display unit (100) inputs a searching command for translating target words and target words. A target word database (DB) unit (200) extracts a target word candidate word in a specific domain massive amount document and constructs a target word DB by calculating the weighted value and the frequency of the target word candidate word. A recommended target word determination unit (300) receives a target word searching signal, extracts a recommended target word, compares the frequency of the recommended target word with the weighted value, selects the recommended target word, and outputs information related to the selected recommended target word to the display unit. [Reference numerals] (100) Display unit; (112) Word input unit; (114) Implementation button unit; (116) Output unit; (200) Target word database (DB) unit; (300) Recommended target word determination unit; (312) Candidate target word determination unit; (314) Comparing unit; (316) Recommended target word selecting unit; (320) Existing target word dictionary unit

    Abstract translation: 目的:提供领域目标词推荐系统及其方法,通过提供目标词的示例来最小化动词和名词选择的错误和错误。 构成:显示单元(100)输入用于翻译目标词和目标词的搜索命令。 目标字数据库(DB)单元(200)通过计算目标词候选词的加权值和频率来提取特定域大量文档中的目标词候选词,并构建目标词DB。 推荐目标字确定单元(300)接收目标字搜索信号,提取推荐目标字,将推荐目标字的频率与加权值进行比较,选择推荐目标字,并输出与所选择的推荐目标相关的信息 字显示单元。 (附图标记)(100)显示单元; (112)字输入单元; (114)实施按钮单元; (116)输出单元; (200)目标字数据库(DB)单元; (300)推荐目标词确定单位; (312)候选目标词确定单位; (314)比较单位; (316)推荐的目标词选择单位; (320)现有目标词字典单位

    터치스크린 환경에서 단어 추천 및 문장 완성 방법
    8.
    发明公开
    터치스크린 환경에서 단어 추천 및 문장 완성 방법 有权
    用于在触摸屏设备中建议和完成声音的系统和方法

    公开(公告)号:KR1020130097888A

    公开(公告)日:2013-09-04

    申请号:KR1020120019525

    申请日:2012-02-27

    CPC classification number: G06F17/26 G06F3/041 G06F17/30002

    Abstract: PURPOSE: A word recommendation and sentence completion system in a touch screen environment and a method thereof are provided to reduce the input time of characters by reducing the occurrence of typing errors. CONSTITUTION: A touch screen unit (100) inputs characters by using virtual keyboards and displays recommended characters based on the inputted characters. A recommended word extraction unit (200) extracts engram data based on the inputted character and outputs the extracted data to the touch screen unit. An engram database (DB) construction unit constructs an engram DB (300) by extracting the engram from a specific domain by connecting to the recommended word extraction unit. [Reference numerals] (110) Text input unit; (120) Recommended word output unit; (130) Input word and a recommended word output unit; (210) Comparative N-gram output unit; (220) Recommended word selecting unit; (300) Comparative N-gram database

    Abstract translation: 目的:提供触摸屏环境中的词推荐和句子完成系统及其方法,以通过减少打字错误的发生来减少字符的输入时间。 规定:触摸屏单元(100)使用虚拟键盘输入字符,并根据输入的字符显示推荐的字符。 推荐字提取单元(200)基于输入的字符提取图像数据,并将提取的数据输出到触摸屏单元。 枚数数据库(DB)构造单元通过连接到推荐的单词提取单元,从特定域中提取图形来构造枚数DB(300)。 (附图标记)(110)文本输入单元; (120)推荐字输出单元; (130)输入字和推荐字输出单元; (210)比较N-gram输出单元; (220)推荐选词单位; (300)比较N-gram数据库

Patent Agency Ranking