一种面向微博客平台文本流的突发话题检测方法及系统

    公开(公告)号:CN103279479A

    公开(公告)日:2013-09-04

    申请号:CN201310138895.0

    申请日:2013-04-19

    Abstract: 本发明提供一种面向微博客平台文本流的突发话题检测方法及系统,其中方法包括:步骤1,实时采集微博客平台的用户数据及用户生成消息数据,并提取出消息文本及配图;步骤2,设定时间窗口对所述消息文本进行划分,获得实时数据流和历史数据;步骤3,选取特征,进行流行度评估模型和长微博提取模型的训练;步骤4,对所述实时数据流利用所述流行度评估模型进行流行度评估,利用所述长微博提取模型进行长微博提取,并分别放入流行消息集合和长微博集合;步骤5,判断所述流行消息集合与所述长微博集合数量是否均达到预设的阈值,若达到,使用LDA模型或加权求和的方式进行话题提取对两个集合的数据提取突发话题,否则返回步骤1。

    一种用户查询意图识别方法

    公开(公告)号:CN103268348A

    公开(公告)日:2013-08-28

    申请号:CN201310204529.0

    申请日:2013-05-28

    Abstract: 本发明提供了一种用户查询意图识别方法,包括:1)对于待识别的用户查询,将其切分为两个命名实体e1,e2和命名实体上下文ct;2)根据用户查询日志的集合和主题模型,计算用户查询中包含命名实体e1,e2和上下文ct的情况下隐含主题r的概率p(r|e1,e2,ct),找出使得概率p(r|e1,e2,ct)最大的主题r,将该主题r作为命名实体e1,e2之间所隐含的关系;所述主题模型是用查询日志聚合文档集合训练得到的主题模型;所述查询日志聚合文档集合是将每两个命名实体在查询日志中的上下文聚合到一起,形成的关于两两命名实体组合的文档集合。本发明识别的准确率和召回率高;时间复杂度低,给搜索引擎造成的负荷较小,能够提升用户体验;特别适合于移动端的搜素或者移动终端本地的应用搜索。

    一种eMule网络上关联资源的发现方法

    公开(公告)号:CN103258052A

    公开(公告)日:2013-08-21

    申请号:CN201310204314.9

    申请日:2013-05-28

    Abstract: 本发明提供一种eMule网络上关联资源的发现方法,包括下列步骤:1)获取用户设置的初始的关键词列表;2)对于当前关键词列表中的每个关键词,在eMule网络中搜索与该关键词相关的资源文件,并记录搜索到的资源文件信息;3)对进行了记录的资源文件的文件名进行分词处理,并将分词得到的新词加入关键词列表中,然后重新执行步骤2);重复执行步骤2)至3)直到满足结束条件。本发明能够全面地发现eMule网络中潜在的用户感兴趣的资源,还能够帮助用户发现特定领域相关的潜在的用户感兴趣的资源。

    在线社会网络中网络群体的检测方法及系统

    公开(公告)号:CN103198432A

    公开(公告)日:2013-07-10

    申请号:CN201310127459.3

    申请日:2013-04-12

    Abstract: 本发明提供一种在线社会网络中网络群体的检测方法,所采集的节点集中随机选择一个节点,从所选节点的邻居节点中选择未与所选节点建立群关系的且收益最大的邻居节点并在该邻居节点与所选节点之间建立群关系;对所选节点进行策略更新,并重新计算由于所选节点的策略更新所影响到的所有节点的收益;不断上述步骤,直到所述节点集中没有收益可改进的节点时,输出节点集中互相之间存在群关系的所有节点作为所检测的网络群体。该方法结合在线社会网络中节点的信息交互行为和节点间的社会关系,可以在在线社会关系网络中发现具有动态特性和行为因素影响的网络群体。

    以PDF文本作为掩体的信息嵌入方法

    公开(公告)号:CN101673334B

    公开(公告)日:2013-04-03

    申请号:CN200910204408.X

    申请日:2004-12-09

    Abstract: 本发明提供一种以一类PDF文本作为掩体的信息嵌入方法,包括:根据嵌入信息生成标识串FlagStr1、标识串FlagStr2,根据隐写密钥生成替换数字串;在所述标识串FlagStr2前加“0.”,将该标识串转化为(0,1)间的实数;构造两个Logistic混沌序列密码生成器Chao1和Chao2;遍历并替换PDF文件的所有TJ操作对象中的数字;将包含完整嵌入信息的PDF文件转换为隐写文件。本发明还提供了一种以一类PDF文本作为掩体的信息提取方法。

    一种获取网络音视频节目地址的方法

    公开(公告)号:CN101635826B

    公开(公告)日:2011-02-09

    申请号:CN200810116933.1

    申请日:2008-07-21

    Inventor: 张斌 张刚 程学旗

    Abstract: 本发明涉及网络通信技术领域,提出一种获取网络音视频节目地址的方法,包括:使用浏览器打开包含音视频节目的多个网页,播放器准备开始播放节目;所述播放器向远程视频服务器请求所述网页,播放器根据页面传递的参数得到需要请求的视频源的网络地址,从远程读取数据源进行播放;获取并分析播放器和远程视频服务器的交互信息,获得所述网络音视频节目地址。利用浏览器控制与网络地址监听相结合的方式来发现网络音视频地址,并应用浏览器判定页面是否包含音视频播放器和控制播放器的播放,解决音视频网页脚本复杂以及FLV难以从页面获取地址的问题。

    识别恶意程序的方法及系统

    公开(公告)号:CN101944167A

    公开(公告)日:2011-01-12

    申请号:CN201010297048.5

    申请日:2010-09-29

    Abstract: 本发明一种识别恶意程序的方法和系统,方法包括:步骤1,获取计算机系统中所有进程的信息和进程行为,根据进程之间的父子关系建立进程关系树,对应每个进程保存进程的信息和进程行为的列表;步骤2,将父进程的进程行为列表中的进程行为分类,按进程关系树从上到下的顺序,依据分类将父进程信息分配到子进程;步骤3,按进程关系树和进程信息进行符号化,依据预设的恶意行为阈值判断出恶意程序,将恶意程序在计算机系统中运行,得到用于判断恶意程序的专家系统;步骤4,当新程序进程产生时,利用专家系统判断新程序是否为恶意程序。本发明的实现复杂度相对于现有技术较低,能够提高效率。

    一种基于十字链表的P2P流媒体下载方法和系统

    公开(公告)号:CN101841557A

    公开(公告)日:2010-09-22

    申请号:CN201010117154.0

    申请日:2010-03-02

    Abstract: 本发明公开了一种基于十字链表的P2P流媒体下载方法和系统。所述方法,包括下列步骤:用户节点采用十字链表数据结构为每个邻居节点维护一个邻居节点下载任务队列,为每个数据分片维护一个数据分片下载任务队列,并将两个队列存储于用户节点本身;所述用户节点在拥有预备下载的数据分片的邻居节点集合中,选择所述用户节点本地所维护的下载任务十字链表中相应邻居节点的下载任务队列中所有任务的估计完成时间最小的邻居节点,将该下载任务交给该节点完成所述数据分片的下载任务,同时更新所述邻居节点下载任务队列和数据分片下载任务队列。

    一种基于关键词的文本情感分类器的训练方法和分类方法

    公开(公告)号:CN101739430A

    公开(公告)日:2010-06-16

    申请号:CN200810227105.5

    申请日:2008-11-21

    Inventor: 谭松波 程学旗

    Abstract: 本发明提供一种基于关键词的文本情感分类器训练方法和分类方法,其中情感分类器训练方法包括下列步骤:1)在旧领域训练集和新领域测试集的文本的关键词中挑选枢纽特征;2)计算描述所述枢纽特征与所述旧领域训练集和新领域测试集的文本中词语的关系的矩阵W;3)由所述旧领域训练集和新领域测试集内的文本构成矩阵X,在映射空间X·W上训练分类器。根据本发明的文本情感分类方法对新领域的文本进行分类的精度更高。

Patent Agency Ranking