-
公开(公告)号:CN111488424A
公开(公告)日:2020-08-04
申请号:CN202010230061.2
申请日:2020-03-27
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/31 , G06F16/38 , G06F16/951 , G06F16/955 , G06F40/14
Abstract: 本发明提出一种特定学术领域人物的发现与跟踪方法,包括:发现步骤,以某一特定学术领域的关键词对论文网站进行检索,以获取对应论文的作者的作者信息,以及该作者的作者详情页链接URL,根据该作者详情页链接URL抽取该作者于该论文网站的所有论文的论文信息;更新步骤,以该作者信息和该论文信息,更新或加入特定学术领域数据库。
-
公开(公告)号:CN115293479A
公开(公告)日:2022-11-04
申请号:CN202210559536.1
申请日:2022-05-23
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
Abstract: 本发明公开了一种舆情分析工作流系统,包括:数据分析功能模块,其包括N个能够进行舆情数据分析的数据分析模块;工作流建立模块,其根据舆情分析需求从数据分析功能模块中选择多个数据分析模块,按顺序进行连接,建立对特定任务进行分析的工作流,针对同一事件不同分析角度的舆情分析需求,建立多个工作流,以对多个舆情分析任务进行分析;工作流管理模块,其对建立的工作流进行数据分析计算,并通过可视化工作流图查看计算结果;事件管理模块,其对同一事件的多个舆情分析任务进行管理,并通过舆情分析数据构建不同任务之间的联系。本发明还提供了舆情分析工作流方法。本系统和方法能够根据舆情分析需求实现从不同层次和不同角度获得舆情信息。
-
公开(公告)号:CN113239663B
公开(公告)日:2022-07-12
申请号:CN202110309085.1
申请日:2021-03-23
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F40/126 , G06F40/216 , G06F40/242 , G06F40/284 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于知网的多义词中文实体关系识别方法,其步骤包括:1)对中文网事数据中的每一条语料样本基于知网进行字颗粒度的向量化,得到每一个字对的字颗粒度向量;然后对每一字颗粒度向量所在的位置信息进行编码,得到语料中每个字与预标注的待识别实体关系对的相对位置编码;2)根据步骤1)所得结果生成每一语料样本的字颗粒度语义向量集合;3)基于知网生成每一语料的词颗粒度语义向量集合;4)利用各语义向量及其对应位置编码训练深度自注意力神经网络,得到深度自注意力神经网络编码器;5)生成待处理语料中字和词汇的语义向量及其对应位置编码输入深度自注意力神经网络编码器,得到该待处理语料中的实体关系。
-
公开(公告)号:CN109033166B
公开(公告)日:2022-01-07
申请号:CN201810636331.2
申请日:2018-06-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/211
Abstract: 本发明公开了一种人物属性抽取训练数据集构建方法。首先,下载HTML页面中的文本数据内容,提取描述人物正文内容和属性信息的信息框数据,并进行编码存储和语句切分;然后,对切分后的语句,选取既包含人物名称、人物属性值内容的语句构建人物属性抽取语料数据集;最后,提取人物属性抽取语料数据集中的所有动词,基于信息熵的方法对所有动词进行排序,提取排名靠前的动词作为属性触发词,把人物属性抽取语料数据集中不包含属性触发词的语句删除掉,剩下的语句就组成了人物属性抽取训练数据集。本发明综合利用的网页数据采集、词性分析、词语信息熵计算等技术自动构建人物属性抽取训练数据集,对提高训练数据集构建的效率具有重要意义。
-
公开(公告)号:CN113255720A
公开(公告)日:2021-08-13
申请号:CN202110393842.8
申请日:2021-04-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06K9/62 , G06Q50/00 , G06F16/901
Abstract: 本发明公开了一种基于分层图池化的多视角聚类方法,包括以下步骤:将待处理数据划分成多视角数据集,然后将多视角数据集按各视角构建对应的图表示,得到对应的视图;采用分层图池化层迭代计算方法提取每个视图的聚类信息,每个视图的聚类信息包括对应该视图的粗化图和分配矩阵,该粗化图包括迭代后的邻接矩阵、特征矩阵、图拉普拉斯矩阵;采用多视角谱聚类融合方法融合所有视图的聚类信息,得到每一类特征向量所对应的类别。具有充分利用待处理数据本身的多视图特征,可以综合包含原各个视图的聚类信息。公开了一种基于分层图池化的多视角聚类系统,包括:图构建模块、聚类信息计算提取模块、多视角融合模块。本发明具有提升聚类效果的有益效果。
-
公开(公告)号:CN111949848A
公开(公告)日:2020-11-17
申请号:CN202010785632.9
申请日:2020-08-06
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/951 , G06F16/9536 , G06F16/958 , G06F16/35 , G06F40/295 , G06F40/216
Abstract: 本发明涉及一种基于特定事件的跨平台传播态势评估及分级方法,属于网络信息领域。本发明的基于特定事件的跨平台传播态势评估及分级方法,具体包括四个功能模块,分别为:原始网络元素检测模块、特定事件的话题传播计算模块、话题传播模型参数的等级评定和威胁分析模块、任务调度和优化模块。本发明解决了现有技术中没有考虑到事件的传播态势评估及分级方法,提出了针对特定事件传播情况的量化评估方法和有区分度的分级手段,建立了信息系统框架,实现了对特定事件的跨平台传播态势评估及分级,同时根据特定事件的跨平台传播态势评估对后续监测工作进行指导,从而有效提高对于事件传播的紧急或影响程度的判断能力,用以指导实际工作。
-
公开(公告)号:CN110134944A
公开(公告)日:2019-08-16
申请号:CN201910275651.4
申请日:2019-04-08
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
Abstract: 本发明公开了一种基于强化学习的指代消解方法,包括:数据预处理:对文本数据进行分词、分句、词性标注、词形还原、命名实体识别、句法解析,词向量转换,得到候选先行词和指代词相关特征;构建神经网络模型:该模型结合词向量和相关特征能够学习指代对的特点和相关语义信息,更好的对候选先行词和指代词进行排序打分,最后得到指代链;使用训练好的模型进行指代消解,输入文本数据,输出消解链。本发明方法针对启发式损失函数的不足,采用奖励衡量的机制来进行深度学习训练,提高了模型效果,针对不同语言数据集自动进行超参设置,免除了手工设置的必要,提高了模型的实用性拓展了适用范围。
-
公开(公告)号:CN119848603A
公开(公告)日:2025-04-18
申请号:CN202411930366.9
申请日:2024-12-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/24 , G06Q50/00 , G06N3/0455 , G06F40/20 , G06N3/042 , G06F18/213
Abstract: 本发明提出一种基于异构图的社交机器人检测方法和装置,包括获取社交网络中指定事件的用户文本,利用大语言模型分析文本间的隐式关联;以该用户文本的账号、内容和话题为节点,构建该指定事件下的异质图;根据预设的元路径,提取该异质图中各账号的特征表示;并利用图神经网络建模该特征表示,得到该元路径下的用户节点表示;将该账号的所有该用户节点表示进行融合,得到该账号的最终表示;将该最终表示输入到分类器中,得到该账号是否属于社交机器人的检测结果。
-
公开(公告)号:CN112214558B
公开(公告)日:2023-08-15
申请号:CN202011296138.2
申请日:2020-11-18
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/28 , G06F16/33 , G06F16/951 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本申请提供了一种主题相关度判别方法及装置,方法包括:对获取的网页构建网页特征向量;利用预先训练的语义向量空间模型对选定的主题特征向量与网页特征向量之间的相似度进行计算;筛选出相似度高于预设值的网页特征向量。本申请结合了语义向量相似度计算和机器学习方法的优点,相比于现有技术,可以实现较高的判别精度,并且本申请在训练样本的筛选上也作出了不同于现有技术的改进。
-
公开(公告)号:CN110134876B
公开(公告)日:2021-10-26
申请号:CN201910360276.3
申请日:2019-04-30
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
IPC: G06F16/9536 , G06F16/35 , G06Q50/00
Abstract: 本发明公开了一种基于群智传感器的网络空间群体性事件感知与检测方法,属于数据挖掘领域,具体步骤如下:一、收集每日的微博流数据;步骤二、根据微博账号的影响力筛选用于感知网络空间群体性事件的传感器账号;步骤三、对传感器账号的微博数据进行去噪处理;步骤四、对去噪后的微博数据按评论转发数进行排序;步骤五、对排序后的微博数据进行去重处理;步骤六、识别出相关事件涉及的时间地点和人物;步骤七、提取与事件相关的微博数据,对该事件进行分类并计算各微博内容的敏感值。本发明通过筛选具有影响力的媒体和用户账号组成群智传感器网络对网络空间群体性事件进行感知,无需对大规模微博数据进行挖掘,有效节省了计算和时间成本。
-
-
-
-
-
-
-
-
-