시간 흐름에 따른 문맥 기반 트렌드 분석 방법
    1.
    发明授权
    시간 흐름에 따른 문맥 기반 트렌드 분석 방법 有权
    基于上下文分析趋势的方法

    公开(公告)号:KR101575683B1

    公开(公告)日:2015-12-09

    申请号:KR1020140187026

    申请日:2014-12-23

    CPC classification number: G06F17/2715 G06F17/218 G06F17/30911

    Abstract: 시간흐름에따른문맥기반트렌드를분석하는방법이개시된다. 상기문맥기반트렌드를분석하는방법은확률분포를계산할수 있는장치를이용하여문서집합으로부터시간흐름에따른문맥기반트렌드를분석하는방법으로서, 각토픽에대해, 단어를선택하기위해사용될어휘분포와해시태그(hashtag)를선택하기위해사용될해시태그분포를추출하는단계, 상기문서집합에포함된각 문서에대해, 토픽분포를추출하는단계, 상기어휘분포, 상기해시태그분포, 및상기토픽분포에대해통계적추론을수행하는단계, 상기문서집합에포함된각 문서의각 단어에대해, 상기토픽분포로부터토픽을추출하고, 시간에대한베타분포(beta distribution)로부터시간을추출하는단계, 및상기문서집합에포함된각 문서의각 단어에대해, 단어또는해시태그를추출하는단계를포함한다.

    Abstract translation: 公开了一种用于根据时间流逝分析基于上下文的趋势的方法,其中基于上下文的趋势根据通过使用能够计算可验证性分布的设备的文档组的时间延迟来分析。 该方法包括以下步骤:提取要用于选择字词的分词和用于选择主题标签的主题标签的分布; 提取关于包含在文档组中的每个文档的主题的分发; 对词的分布,主题标签的分布以及主题的分布进行统计推理; 从关于包含在文档组中的每个文档的每个单词的主题的分发中提取主题并从时间上从beta分发中提取时间; 并且提取关于文档组中包括的每个文档的每个单词的标题或标题。

    시맨틱 토픽 추출 장치 및 방법
    2.
    发明授权
    시맨틱 토픽 추출 장치 및 방법 有权
    提取语义主题的设备和方法

    公开(公告)号:KR101423544B1

    公开(公告)日:2014-08-01

    申请号:KR1020120141313

    申请日:2012-12-06

    Abstract: 본 발명은 확률 분포를 계산할 수 있는 장치를 이용하여, 평가 대상에 대한 의견이 기술된 하나 이상의 문서 집합에서 시맨틱 토픽(semantic topic)을 추출하는 방법에 있어서, (a) 전역 토픽-감상 쌍에 대한 어휘 분포 및 지역 토픽-감상 쌍에 대한 어휘 분포를 추출하는 단계; (b) 상기 문서 집합의 각 문서에 대해, 전역 토픽 분포(global topic distribution) 및 전역 토픽에 대한 감상 분포(sentiment distribution), 지역 토픽 분포(local topic distribution) 및 지역 토픽에 대한 감상 분포를 추출하는 단계; (c) 상기 (a) 및 (b) 단계에서 추출된 각 분포에 대해 통계적 추론을 수행하는 단계; 및 (d) 상기 문서 집합의 각 문서의 각 단어에 대해, 상기 전역 토픽 분포 및 전역 토픽에 대한 감상 분포 또는 지역 토픽 분포 및 지역 토픽에 대한 감상 분포로부터, 전역 또는 지역 토픽 및 상기 전역 또는 지역 토픽과 연관된 감상을 추출하고, 상기 추출된 토픽 및 감상을 기초로, 상기 전역 토픽-감상 쌍에 대한 어휘 분포 또는 지역 토픽-감상 쌍에 대한 어휘 분포로부터 단어를 추출하는 단계;를 포함하는 시맨틱 토픽 추출 방법을 제공한다.

    웹 크롤링 시스템 및 그 방법
    3.
    发明授权
    웹 크롤링 시스템 및 그 방법 失效
    网络抓取系统及其方法

    公开(公告)号:KR100993818B1

    公开(公告)日:2010-11-12

    申请号:KR1020090013597

    申请日:2009-02-18

    Abstract: 본 발명은 웹 크롤링에 소요되는 시간을 획기적으로 단축시킬 수 있는 웹 크롤링 시스템에 관한 것이다.
    본 명세서에서 개시하는 웹 크롤링 시스템은 웹 크롤링을 위한 기준 웹 페이지들(시드 페이지들(seed pages))을 설정하고, 웹 크롤링을 통해 발견되는(Discovered) 상기 시드 페이지들의 각 시드 페이지(p
    i )에의 접근 확률(중요도)을 산출하여 상기 각 시드 페이지(p
    i )에 우선순위를 부여하는 시드 페이지 우선순위 부여부; 상기 부여된 각 시드 페이지(p
    i )의 우선순위 중 가장 높은 순위를 갖는 시드 페이지(p
    i
    ,
    max )를 추출하여 우선적으로 다운로드하되, 상기 시드 페이지(p
    i
    ,
    max )에 링크된 외부링크(outlink) 페이지들도 일괄적으로 다운로드하는 다운로드부; 및 상기 다운로드된 외부링크 페이지들의 각 링크 페이지(p
    j )에 대한 상기 시드 페이지(p
    i,max )내에서의 접근 확률(중요도)을 산출하여, 상기 각 링크 페이지(p
    j )에 우선순위를 부여하는 외부링크 페이지 우선순위 부여부를 포함하여 본 시스템 발명의 과제를 해결한다.

    시맨틱 토픽 추출 장치 및 방법
    4.
    发明公开
    시맨틱 토픽 추출 장치 및 방법 有权
    提取语义主题的设备和方法

    公开(公告)号:KR1020140073717A

    公开(公告)日:2014-06-17

    申请号:KR1020120141313

    申请日:2012-12-06

    Abstract: The present invention relates to a method for extracting a semantic topic from at least one document set including opinions related to evaluation targets using a device capable of calculating a probability distribution, which comprises the steps of: (a) extracting a vocabulary distribution for global topic-sentiment pairs and a vocabulary distribution for local topic-sentiment pairs; (b) extracting a global topic distribution and a sentiment distribution for the global topic, and a local topic distribution and a sentiment distribution for the local topic with respect to each document of the document sets; (c) carrying out statistical inference for each distribution extracted in steps (a) and (b); (d) extracting, from the global topic distribution and the sentiment distribution for the global topic or the local topic distribution and the sentiment distribution for the local topic with respect to each word of each document of the document sets, the global or local topic and the sentiment related to the global or local topic, and extracting words from the vocabulary distribution for the global topic-sentiment pairs or the vocabulary distribution for the local topic-sentiment pairs on the basis of the extracted topic and sentiment.

    Abstract translation: 本发明涉及一种用于从至少一个文档集中提取语义主题的方法,该方法包括使用能够计算概率分布的设备的与评估目标相关的意见,其包括以下步骤:(a)提取全局主题的词汇分布 本地主题情感对的音符对和词汇分布; (b)提取全球主题的全球主题分布和情绪分布,以及针对文件集的每个文件的本地话题的本地主题分布和情绪分布; (c)对在步骤(a)和(b)中提取的每个分布进行统计推断; (d)从全球主题分布和全球话题的情绪分布,本地主题分布以及本地主题的情绪分布中提取文件集中每个文档的每个单词,全球或地方主题以及 与全球或地方话题相关的情绪,并根据提取的话题和情绪,从全球话题情感对的词汇分布中提取词汇,或者为本地话题情绪对提供词汇分布。

    웹 크롤링 시스템 및 그 방법
    5.
    发明公开
    웹 크롤링 시스템 및 그 방법 失效
    网络破解系统及其方法

    公开(公告)号:KR1020100094263A

    公开(公告)日:2010-08-26

    申请号:KR1020090013597

    申请日:2009-02-18

    CPC classification number: G06F17/30864

    Abstract: PURPOSE: A system for web crawling and a method thereof are provided to remarkably reduce the time taken for web crawling by simultaneously downloading external link pages linked to the webpage which has the highest access probability. CONSTITUTION: A seed page priority assigner(11) sets up standard seed pages for web crawling, produces access probability of the seed pages detected through the web crawling and gives priority to the seed page. A downloader(12) downloads the seed page having the highest priority and outlink pages linked to the seed page collectively. An outlink page priority assigner(13) produces access possibility of the seed page and gives the priority to an external link page.

    Abstract translation: 目的:提供一种用于网页爬行的系统及其方法,通过同时下载链接到具有最高访问概率的网页的外部链接页面,显着减少网页爬行所花费的时间。 构成:种子页面优先分配器(11)设置用于网络爬行的标准种子页面,产生通过网络爬行检测到的种子页面的访问概率,并优先考虑种子页面。 下载器(12)下载具有最高优先级的种子页面和链接到种子页面的链接页面。 超链接页面优先分配器(13)产生种子页面的访问可能性,并给出外部链接页面的优先级。

Patent Agency Ranking