-
公开(公告)号:CN109145109A
公开(公告)日:2019-01-04
申请号:CN201710464424.7
申请日:2017-06-19
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/2458 , G06Q50/00
CPC classification number: G06Q50/01
Abstract: 本发明涉及一种基于社交网络的用户群体消息传播异常分析方法和装置,包括:获取在线社交网络中用户群体的历史聊天记录,根据预先设定的时间跨度,获取历史聊天记录在时间跨度内用户群体中所有用户所发布的消息,作为消息集合;对于消息集合,根据预先设定的时间范围统计用户群体在每个时间范围内所发布的消息总数;基于时序相关性的特征提取法,对每个消息总数的特征进行提取,并将提取结果集合为样本集合;根据消息总数并采用聚类算法为样本集合对样本集合进行聚类,生成异常样本;根据异常样本判定其所在的用户群体存在消息传播异常。由此本发明能够应对数据涌发现象,同时算法直观简单,准确率更高,且本发明应用场景广泛。
-
公开(公告)号:CN114003803B
公开(公告)日:2024-08-13
申请号:CN202110944831.4
申请日:2021-08-17
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F16/9536 , G06F16/9537 , G06Q50/00
Abstract: 本发明提出一种社交平台上特定地域的媒体账号发现方法及系统。在解决社交平台上特定地区媒体账号发现任务时,发明人发现已有方法难以快速地获取高质量的种子媒体账号信息,因此设计了一套针对种子媒体账号快速标注的方法,包括候选账号的确定与账号分类。发明人发现已有方法的特征设计存在特征较弱、无法体现媒体账号特性、难以大规模实施等问题,因此设计了针对媒体账号特性的特征抽取方法。该方法速度快、抽取的特征强。发明人发现已有方法难以高效、高质量地从种子账号扩充到更多的媒体账号。因此在解决了种子账号标注与特征抽取方法的基础上,设计了两种互为补充的扩充方法以获取高质量、高数量的媒体账号。
-
公开(公告)号:CN114003803A
公开(公告)日:2022-02-01
申请号:CN202110944831.4
申请日:2021-08-17
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F16/9536 , G06F16/9537 , G06Q50/00
Abstract: 本发明提出一种社交平台上特定地域的媒体账号发现方法及系统。在解决社交平台上特定地区媒体账号发现任务时,发明人发现已有方法难以快速地获取高质量的种子媒体账号信息,因此设计了一套针对种子媒体账号快速标注的方法,包括候选账号的确定与账号分类。发明人发现已有方法的特征设计存在特征较弱、无法体现媒体账号特性、难以大规模实施等问题,因此设计了针对媒体账号特性的特征抽取方法。该方法速度快、抽取的特征强。发明人发现已有方法难以高效、高质量地从种子账号扩充到更多的媒体账号。因此在解决了种子账号标注与特征抽取方法的基础上,设计了两种互为补充的扩充方法以获取高质量、高数量的媒体账号。
-
公开(公告)号:CN119513312A
公开(公告)日:2025-02-25
申请号:CN202411503651.2
申请日:2024-10-25
Applicant: 中国科学院计算技术研究所
IPC: G06F16/353 , G06F16/334 , G06F40/186 , G06F18/241
Abstract: 本发明提供了一种针对文本的讽刺检测方法,包括:获取待分析文本及其讽刺上下文信息,其中,讽刺上下文信息是指用于辅助判断待分析文本是否带有讽刺情绪的语境信息;根据待分析文本及其讽刺上下文信息,评估待分析文本的讽刺上下文信息的充足性;在待分析文本的讽刺上下文信息不充足的情况下,根据预设的上下文信息检索库提供补充的上下文信息,得到更新的讽刺上下文信息;根据待分析文本及其最新的讽刺上下文信息,确定待分析文本是否带有讽刺的情绪。
-
公开(公告)号:CN117235640A
公开(公告)日:2023-12-15
申请号:CN202311067335.0
申请日:2023-08-23
Applicant: 中国科学院计算技术研究所
IPC: G06F18/2433 , G06F18/24 , G06F18/23 , G06F18/213 , G06F40/35
Abstract: 本发明提出一种异常话题检测方法、装置,方法包含:采集社交媒体平台的热搜榜单话题数据作为样本数据,对所述榜单话题数据进行特征表达,确定话题特征,构造特征判定规则模型;对所有话题特征进行聚类,划分自然话题群体、异常话题群体;识别不属于所述自然话题群体和所述异常话题群体的离群异常话题,动态调整话题归属,构造话题归属模型;将待检测话题依次输入至所述特征判定规则模型与话题归属模型,判定是否为异常话题。该方法有效提高了社交媒体平台榜单异常话题的识别精度,进而有效对抗社交媒体中的操纵和攻击。
-
公开(公告)号:CN117076598A
公开(公告)日:2023-11-17
申请号:CN202310518172.7
申请日:2023-05-09
Applicant: 中国科学院计算技术研究所
IPC: G06F16/33 , G06F16/953 , G06F40/30 , G06F18/25
Abstract: 本发明提出一种基于自适应权重的语义检索模型融合方法,包括:以检索信息进行稀疏检索,获取稀疏检索结果及对应的稀疏排序分值;以该检索信息进行稠密检索,获取稠密检索结果及对应的稠密排序分值;构建权重预测模型,基于该检索信息、该稀疏检索结果和该稠密检索结果通过该权重预测模型获取融合权重;以该融合权重、该稀疏排序分值和该稠密排序分值,生成融合排序分值;根据该融合排序分值,将该稀疏检索结果和该稠密检索结果进行排序,生成最终检索结果。本发明还提出一种基于自适应权重的语义检索模型融合系统,以及一种用于基于自适应权重的语义检索模型融合的数据处理装置。
-
公开(公告)号:CN116796283A
公开(公告)日:2023-09-22
申请号:CN202310602592.3
申请日:2023-05-25
Applicant: 中国科学院计算技术研究所
IPC: G06F18/25 , G06F18/2413 , G06F18/22 , G06F18/20 , G06N5/025
Abstract: 本发明提出一种基于网络社交平台的社交机器人群体检测方法和系统,包括:构建用于社交机器人个体识别的强特征,将网络社交平台中符合该强特征的账号识别为种子账号;基于该种子账号的社交网络关系进行扩线分析,并结合昵称检测进行相似昵称范式社群的发现和总结,得到基于种子账号的社交机器人社群;采用图卷积聚类社群发现方法,将该网络社交平台的图结构和文本信号融入到社群检测当中,并通过该社交机器人社群和种子账号,确定机器人覆盖率大于阈值的重点社群,作为社交机器人群体检测结果。
-
公开(公告)号:CN116126553A
公开(公告)日:2023-05-16
申请号:CN202211689339.8
申请日:2022-12-27
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于编排执行的信息获取方法,包括:根据对目标信源的多层树状采集需求生成任务树,编排该任务树的初始配置;将该初始配置放入任务队列;由原子采集器获取该初始配置,根据该初始配置生成根采集任务;执行该根采集任务,生成该根采集任务的子任务的任务配置,将该任务配置放入任务队列,并输出该根采集任务的采集结果;由原子采集器获取任务配置,根据该任务配置生成当前任务;执行该当前任务,生成该当前任务的子任务的任务配置,将该任务配置放入任务队列,并输出该当前任务的采集结果;重复本步骤,直到完成该任务树。本发明还提出一种基于编排执行的信息获取系统,以及一种用于实现基于编排执行的信息获取的数据处理装置。
-
公开(公告)号:CN114528459A
公开(公告)日:2022-05-24
申请号:CN202210044347.0
申请日:2022-01-14
Applicant: 中国科学院计算技术研究所
IPC: G06F16/951 , G06F16/958 , G06F16/35 , G06F40/30 , G06F40/146
Abstract: 本发明提出一种基于语义的网页信息抽取方法,包括:获取目标网页的目标DOM树,对该目标DOM树的目标骨架节点按句进行分裂,得到该目标DOM树的目标骨架子节点;以分类模型按目标任务语义对所有该目标骨架子节点进行分类,获得该目标DOM树的目标信息子节点;对所有该目标信息子节点形成的节点路径进行聚类,获得该目标网页的目标信息树,对该目标信息树中包含的网页信息进行抽取。本发明还提出一种基于语义的网页信息抽取系统,以及一种用于实现基于语义的网页信息抽取的数据处理装置。
-
公开(公告)号:CN114119027A
公开(公告)日:2022-03-01
申请号:CN202110482852.9
申请日:2021-04-30
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种多属性的耦合稠密异常交易子图检测方法和系统。包括:将具有多属性的信息流建模为两个耦合的张量,并提出了一种新的多属性异常度量来准确地找到其中的稠密子张量。同时,本发明能很好地应用于非法资金转移检测问题:非法资金转移通常是一种从源账户开始,经过中间账户,汇聚到目标账户的资金流动过程,同时还具有快进快出、中间账户清空等性质。使用本发明能够有效捕捉欺诈性账户密集、可疑的非法资金转移行为;本发明设计的多属性异常度量也能够有效结合中间账户在短时间内清空余额的特点,进而准确地检测出非法资金转移交易链。
-
-
-
-
-
-
-
-
-