-
公开(公告)号:CN104657745A
公开(公告)日:2015-05-27
申请号:CN201510046891.9
申请日:2015-01-29
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种已标注样本的维护方法及双向学习交互式分类方法。本方法一方面采用正向学习从未标注集中选取最有价值的样本,另一方面采用反向学习从已标注集中检测并处理导致模型性能退化潜在噪声,从而优化改善已标注集;本发明通过正向学习与反向学习的有机结合、借助人机交互机制,获得高效、优化的海量数据分类模型,对未标注样本进行分类。本发明通过正向学习与反向学习的有机结合,在高效利用标注信息的同时自动优化标注信息,实现高效化、智能化的交互式分类。
-
公开(公告)号:CN111985333B
公开(公告)日:2023-01-17
申请号:CN202010698168.X
申请日:2020-07-20
Applicant: 中国科学院信息工程研究所
IPC: G06V20/40 , G06V10/56 , G06V10/774 , G06V10/778 , G06V10/82 , G06N3/04
Abstract: 本发明提供一种基于图结构信息交互增强的行为检测方法及电子装置,包括提取一视频的n维视频特征,计算该n维视频特征基于自注意力的n维视频特征表达及各视频特征表达维度的自注意力权重向量,并根据n维视频特征表达,构建一图特征表达;将图特征表达输入一已训练的对抗网络,得到视频特征向量,并对视频特征向量进行分类;根据分类结果及自注意力权重向量,获取该视频的帧类别激活结果,分辨视频中的各动作或背景,得到所述视频中各动作的发生时间段。本发明可对复杂的视频动作和背景的视觉‑运动相关性灵活而明确的建模,更好的学习长视频特征,大大降低了计算复杂度以及时序标注的时间。
-
公开(公告)号:CN115174147A
公开(公告)日:2022-10-11
申请号:CN202210622904.2
申请日:2022-06-01
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40
Abstract: 本发明公开了一种基于对抗扰动的实时网络连接隐私保护方法和系统。本方法为:收集不同网络应用的流量数据,以网络会话为单位分割原始的网络流量,并提取网络会话的时序特征序列;对同一应用的时序特征序列进行标准化;利用标准化后的时序特征序列,构建不同网络应用的时序特征序列指纹模型;根据构建的时序特征序列指纹模型,实时对经过的网络流量进行无目标网络流量扰动与有目标网络流量扰动,以欺骗攻击者的网络流量分析模型,从而保护用户网络流量连接隐私。本发明可以使用已知的网络应用的流量数据构建对应的应用指纹模型,并且对经过部署结点的流量进行无目标或有目标的实时扰动,模糊网络流量的指纹特征,从而保护用户的网络流量连接隐私。
-
公开(公告)号:CN114978593A
公开(公告)日:2022-08-30
申请号:CN202210397693.7
申请日:2022-04-15
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于图匹配的的不同网络环境的加密流量分类方法及系统,属于网络流量管理领域,利用设计的加密流量聚类算法与基于图匹配的加密流量匹配分类方法,分别聚合不同网络的同种类加密流量,并且匹配不同网络下的同种加密流量簇,将已知标签映射到匹配的加密流量簇中,从而分类待测加密流量。
-
公开(公告)号:CN109800785A
公开(公告)日:2019-05-24
申请号:CN201811518273.X
申请日:2018-12-12
Applicant: 中国科学院信息工程研究所
IPC: G06K9/62
Abstract: 本发明公开了一种基于自表达相关的数据分类方法和装置。本方法为:1)在生成对抗网络框架下,通过生成器生成针对给定类别标签的假数据;主动学习算法在生成对抗网络每次迭代中从训练数据集选取有用的未标注的数据进行标注,添加到训练数据集A中;半监督学习在生成对抗网络每次迭代中从训练数据集未标注的样本数据中随机假标注一批样本数据,添加到训练数据集A中,直至生成对抗网络收敛;2)将生成对抗网络迭代结束时,将生成器最终生成的假数据添加到最终的训练数据集A中,然后利用分类器对最终的训练数据集A进行分类。本发明能解决标记数据不足以及训练集中类别数据不均衡的问题,以进一步提高分类准确性。
-
公开(公告)号:CN107220363A
公开(公告)日:2017-09-29
申请号:CN201710422561.4
申请日:2017-06-07
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F16/2282 , G06F16/2471
Abstract: 本发明涉及一种支持全局复杂检索的跨地域查询方法及系统。该方法包括:1)建立用于跨地域查询的全局元数据组织结构,其包括全局视图以及全局视图与各数据中心的数据表的映射关系;2)根据各数据中心的数据表的结构调整,动态调整全局视图与各数据中心的数据表的映射关系;3)解析用户的查询请求,根据全局元数据组织结构将查询任务下发至各数据中心执行查询,各数据中心将查询结果反馈至全局点;4)全局点将各数据中心返回的查询结果进行汇总,并将汇总后的数据展示给用户,从而实现跨地域查询。本发明能够提高对各数据中心大数据的综合分析能力,在大数据处理领域具有很强的实用性和应用范围,具有广阔的应用前景。
-
公开(公告)号:CN106127305A
公开(公告)日:2016-11-16
申请号:CN201610439325.9
申请日:2016-06-17
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种针对多源异构数据的异源间相似性度量方法。该方法利用多源异构数据间的语义互补性,基于子空间学习方法,根据马氏距离度量和伪度量约束,将多源异构数据线性投影到一个特征同构空间,消除了异源间的特征异构性,实现了异源间的相似度对比,并在这个空间中充分嵌入异源间的互补信息。本发明对包括多源检索,聚类和分类这样的现实应用有着十分重要的意义。
-
公开(公告)号:CN104951503A
公开(公告)日:2015-09-30
申请号:CN201510252988.5
申请日:2015-05-18
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F17/30551 , G06F17/30289
Abstract: 本发明公开了一种新鲜度敏感的大数据概要信息维护及聚合值查询方法。本方法为:1)对每个时间对象的时间对象数据建立一时间追踪器;2)对于待写入的时间对象数据,根据时间对象映射到对应的追踪器,然后追踪器将对应的时间对象数据划分为多个时间阶段并设置每一时间阶段的误差参数;3)追踪器根据每一时间阶段的误差参数对该时间阶段内的时间对象数据进行采样并保存对该时间追踪器对应的样本集合中。查询时首先根据时间对象的关键字key定位到对应的时间追踪器;然后追踪器根据查询时间信息查找该时间追踪器中的时间阶段,根据找到的时间阶段对应的样本返回查询值。本发明有效管理并查询时间对象数据,支持面向主题的更高层次的计算应用。
-
公开(公告)号:CN117857201B
公开(公告)日:2024-11-26
申请号:CN202410078748.7
申请日:2024-01-19
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40
Abstract: 本发明公开一种基于流量指纹蒸馏的设备入网行为检测方法和系统,所述方法包括:收集不同移动设备加入内部局域网时产生的流量数据,以一定时间内的单次入网事件为单位分割入网流量;基于分割入网流量,提取每个入网事件中的域名特征,并通过为每一类移动设备构建初始的域名森林,得到每一类移动设备的初始指纹;蒸馏与优化每一类移动设备的初始指纹;基于优化后的移动设备指纹审计经过的网络流量,得到设备入网行为检测结果。本发明可以实现移动设备入网行为的识别与设备具体型号的分类。
-
公开(公告)号:CN116318787A
公开(公告)日:2023-06-23
申请号:CN202211571092.X
申请日:2022-12-08
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , G06N5/01 , G06N3/0442 , G06N3/08 , G06F18/2431
Abstract: 本发明公开了一种基于可解释人工智能的实时入侵检测方法及系统。本方法为:1)将数据集中每一网络流的前置字节作为对应网络流的特征表示;2)将不可导的决策树模型连接到流序列深度模型之后;将流序列深度模型中输出层的参数与网络流的特征表示对位相乘后,作为决策树模型的输入,训练决策树模型;3)使用多层感知机替代决策树模型,使用处理后的数据集进行训练;训练时使用决策树模型的平均决策路径深度函数作为损失函数;4)循环迭代进行步骤2)~3),训练结束后得到可解释的决策树模型;5)遍历决策树模型中的入侵流量判定路径上的决策条件,形成等价的入侵流量检测规则集合;6)根据入侵流量检测规则集合对网络流量进行实时检测。
-
-
-
-
-
-
-
-
-