一种用户需求导向的互联网舆情获取方法

    公开(公告)号:CN103235777B

    公开(公告)日:2018-05-04

    申请号:CN201210585186.2

    申请日:2012-12-28

    Inventor: 刘欣然 李焱 赵丽

    Abstract: 本发明提供一种用户需求导向的互联网舆情获取方法,包括:用户通过业务用户Portal界面登录进入互联网舆情获取系统,系统根据云计算互联网数据采集与存储平台里存储的用户的舆情需求通过业务用户Portal界面向用户展示舆情信息;云计算互联网数据采集与存储平台里存储的用户的舆情需求包括采集的用户的显式舆情需求和隐式舆情需求,显式舆情需求为用户通过业务用户Portal界面的任务定制界面输入的舆情需求,隐式舆情需求为系统分析后得到的用户的舆情需求。本发明提供的一种用户需求导向的互联网舆情获取方法,用户可以通过业务用户Portal界面浏览信息,在信息浏览的过程中可逐步精细化自己的舆情需求,并可以在浏览信息时随时定制一条舆情获取任务。

    一种中文微博突发热点话题检测方法

    公开(公告)号:CN104063428A

    公开(公告)日:2014-09-24

    申请号:CN201410251473.9

    申请日:2014-06-09

    Inventor: 赵丽 刘欣然 李焱

    CPC classification number: G06F16/35 G06F16/958

    Abstract: 本发明提供了一种中文微博突发热点话题检测方法,该方法包括以下步骤:通过微博站点的数据接口获取所述微博站点的微博帖,所述微博帖包括提取的正文和发表时间;根据所述微博帖建立参考微博帖集合;确定检测微博帖集合;运用二元覆盖法进行切词;确定突发词,建立突发词聚类;确定热点话题,对所述热点话题排序。该方法针对海量中文微博帖中的突发话题检测,利用突发话题在微博帖中出现的特征,采用检测突发词和突发词聚类相结合的方法,能够准确的检测出突发话题。

    一种针对含特殊字符的URL编码后的自动解码方法

    公开(公告)号:CN103092922A

    公开(公告)日:2013-05-08

    申请号:CN201210585397.6

    申请日:2012-12-28

    Inventor: 刘欣然 李焱 赵丽

    Abstract: 本发明提供一种针对含特殊字符的URL编码后的自动解码方法,包括:步骤S1.输入需要解码的编码后的URL字符串;步骤S2.按照不同的编码方式对编码后的URL字符串进行解码,得到不同的URL字符串;步骤S3.对得到的不同的URL字符串按照其对应的解码方式进行编码,得到不同的编码后的URL字符串;步骤S4.将得到的不同的编码后的URL字符串与输入的需要解码的编码后的URL字符串进行对比,如果得到的不同的编码后的URL字符串中有一个与需要解码的编码后的URL字符串相同,取编码后的URL字符串对应的编码方式下步骤S2中得到的URL字符串为需要解码的编码后的URL字符串自动解码得到的URL字符串,精确得到需要解码的编码后的URL字符串的编码方式进行解码。

Patent Agency Ranking