-
公开(公告)号:CN105095988A
公开(公告)日:2015-11-25
申请号:CN201510379930.7
申请日:2015-07-01
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明适用于网络信息传播检测技术领域,提供了一种社交网络信息爆发检测方法,包括:采集社交网络的结构和用户产生内容;构建用户的话题传播概率矩阵;获取社交网络中用户发布或转发的消息;根据消息的转发标志和时间信息构建消息的传播轨迹;根据所述话题传播概率矩阵构建消息传播矩阵;根据所述消息的传播轨迹和消息传播矩阵,分析消息爆发的可能性。本发明还相应的提供一种实现上述方法的社交网络信息爆发检测系统。借此,本发明可以有效的预测社交网络消息是否会爆发传播。
-
公开(公告)号:CN106294405A
公开(公告)日:2017-01-04
申请号:CN201510264354.1
申请日:2015-05-22
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F16/9535 , G06F16/35
Abstract: 本发明公开一种微博子话题演化分析方法及装置,能够准确快速地识别微博子话题,并分析出微博子话题的演化关系。所述方法包括:通过改进的最近邻方法对当前时间窗口中的每个微博话题的特征进行聚类,以根据聚类结果生成相应的子话题;根据当前时间窗口中子话题与上一时间窗口中子话题的相似性确定子话题的演化关系。
-
公开(公告)号:CN106294336A
公开(公告)日:2017-01-04
申请号:CN201510236795.0
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明公开一种用于微博的突发特征检测方法及装置,涉及网络信息挖掘技术领域,用以解决现有技术中微博信息噪音大、数据多样突发特征检测准确率低的问题。所述方法包括:根据信息流中有意义串的被检特征的瞬时爆发情况,检测出候选突发特征;将所述候选突发特征中的频繁伪突发特征和间歇性伪突发特征滤除。
-
公开(公告)号:CN106294332B
公开(公告)日:2020-02-14
申请号:CN201510236598.9
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536 , G06F40/30 , G06Q50/00
Abstract: 本发明提供一种微博话题特征提取方法及装置,用以解决目前采用静态词典中的词语特征来表示微博文本,会遗漏大量的关键特征,不能准确反映实时微博信息的问题。该方法包括:提取微博中的有意义字符串,有意义字符串为包含具有语义、能够独立使用的语言单元;提取有意义字符串的异质属性信息;根据异质属性信息对有意义字符串进行分类,得到微博话题相关的特征项,采用该方案能提高微博信息中的特征项提取的准确性。
-
公开(公告)号:CN106294336B
公开(公告)日:2020-02-14
申请号:CN201510236795.0
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535
Abstract: 本发明公开一种用于微博的突发特征检测方法及装置,涉及网络信息挖掘技术领域,用以解决现有技术中微博信息噪音大、数据多样突发特征检测准确率低的问题。所述方法包括:根据信息流中有意义串的被检特征的瞬时爆发情况,检测出候选突发特征;将所述候选突发特征中的频繁伪突发特征和间歇性伪突发特征滤除。
-
公开(公告)号:CN106294335B
公开(公告)日:2020-01-14
申请号:CN201510236792.7
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536
Abstract: 本发明要解决的技术问题是提供一种用于微博的热点话题检测方法及装置,涉及网络信息挖掘技术领域,能够解决特征高度稀疏的微博文本热点话题检测困难的问题。所述方法包括:提取信息流中的有意义串并对所述有意义串进行热度分析,以从中筛选出热点特征;根据信息瓶颈理论对所述热点特征进行特征合并,并且计算合并后的合并程度指示参数;根据所述合并程度指示参数确定热点话题。
-
公开(公告)号:CN106294335A
公开(公告)日:2017-01-04
申请号:CN201510236792.7
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明要解决的技术问题是提供一种用于微博的热点话题检测方法及装置,涉及网络信息挖掘技术领域,能够解决特征高度稀疏的微博文本热点话题检测困难的问题。所述方法包括:提取信息流中的有意义串并对所述有意义串进行热度分析,以从中筛选出热点特征;根据信息瓶颈理论对所述热点特征进行特征合并,并且计算合并后的合并程度指示参数;根据所述合并程度指示参数确定热点话题。
-
公开(公告)号:CN106294332A
公开(公告)日:2017-01-04
申请号:CN201510236598.9
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提供一种微博话题特征提取方法及装置,用以解决目前采用静态词典中的词语特征来表示微博文本,会遗漏大量的关键特征,不能准确反映实时微博信息的问题。该方法包括:提取微博中的有意义字符串,有意义字符串为包含具有语义、能够独立使用的语言单元;提取有意义字符串的异质属性信息;根据异质属性信息对有意义字符串进行分类,得到微博话题相关的特征项,采用该方案能提高微博信息中的特征项提取的准确性。
-
公开(公告)号:CN105975504A
公开(公告)日:2016-09-28
申请号:CN201610273082.6
申请日:2016-04-28
Applicant: 中国科学院计算技术研究所
CPC classification number: G06F16/951 , G06N3/0454 , G06N3/08 , G06Q50/01
Abstract: 本发明提出一种基于循环神经网络(Recurrent Neural Network,RNN)的社交网络消息爆发检测方法及系统,涉及在线社交网络中内容的流行度预测技术领域,该方法包括获取社交网络中用户发布与转发的历史消息,对所述历史消息进行预处理,获取历史转发时间序列;对所述历史消息与所述历史转发时间序列进行循环神经网络训练,并生成预测模型;实时采集用户发布与转发的消息,根据所述消息,生成转发时间序列,将所述转发时间序列输入到所述预测模型,生成特征表达,将所述特征表达输入到全连接神经网络进行分类,结果以softmax方式输出,以完成社交网络消息爆发检测。
-
-
-
-
-
-
-
-