一种基于动态阈值的序列模式挖掘方法及其用途

    公开(公告)号:CN110609857A

    公开(公告)日:2019-12-24

    申请号:CN201910811085.4

    申请日:2019-08-30

    Abstract: 本发明属于数据处理技术领域,涉及一种序列模式的挖掘方法。该方法包括:利用时间窗口对原始序列进行划分,形成时间序列集;扫描时间序列集,获取一项式集合;根据频繁一项式定义采用动态阈值对一项式进行筛选,将非频繁的项从序列集中删除,得到频繁一项式集;从频繁一项式集中的第一项开始以所述的第一项为前缀构造后缀,对后缀进行频繁多项式的挖掘,满足频繁多项式定义的项为频繁项,当后缀为空时,挖掘结束;遍历频繁一项式集合,迭代进行上一步操作,直到频繁一项式集合被遍历完成,得到频繁项集合。本发明的方法,在识别频繁一项式时,采用了动态变化的支持度阈值;不仅对不同序列之间频繁出现的模式进行挖掘,也挖掘一个序列内部频繁出现的模式。

    一种面向情报分析的人机交互系统及其数据处理方法

    公开(公告)号:CN110363586A

    公开(公告)日:2019-10-22

    申请号:CN201910594639.X

    申请日:2019-07-03

    Abstract: 本发明公开了一种面向情报分析的人机交互系统及其数据处理方法,所述系统包括人机交互界面、数据输入模块、数据获取模块、数据处理模块、数据分析模块、结果展示模块,所述数据输入模块用于为用户提供输入接口;所述数据获取模块采用信息爬取方式获取情报信息,数据获取方式包括但不限于通用搜索、新闻搜索、社交搜索、论坛搜索、本地搜索、暗网搜索、学者搜索、企业搜索;所述数据处理模块用于对获取的情报信息进行数据处理,提高情报信息的质量,并保存处理结果;所述数据分析模块用于深入挖掘情报,并将挖掘结果交给结果展示模块进行可视化展示。本发明实现数据处理可视化,提高情报分析的准确性。

    一种通用的用户桌面行为模拟系统及方法

    公开(公告)号:CN109189519A

    公开(公告)日:2019-01-11

    申请号:CN201810837024.0

    申请日:2018-07-26

    Abstract: 本发明提供通用的用户桌面行为模拟系统及方法,通过采集和分析用户行为,挖掘用户行为中蕴含的软件操作知识,构建用户行为的表述模型,从而实现智能自动化的桌面行为脚本生成,提供软件自动化使用和模拟指定真实用户桌面行为的功能。针对网络靶场和测试床中对逼真用户行为模拟和桌面环境下执行自动化软件操作、智能脚本生成的需求,提供了一种通用的用户桌面行为模拟系统及方法。该系统能够精确采集所需行为数据,既可以高度复现用户的历史行为,又可以挖掘用户行为蕴含的软件操作知识,从而实现自动化操作、脚本生成和用户桌面行为模拟。

    一种用户鼠标行为的合成与模拟方法及系统

    公开(公告)号:CN107908300A

    公开(公告)日:2018-04-13

    申请号:CN201711148377.1

    申请日:2017-11-17

    Abstract: 本发明涉及一种用户鼠标行为的合成与模拟方法及系统,包括:(1)数据采集与处理:实时采集用户的原始鼠标数据,分割、清洗后,存入历史操作数据库;(2)模型训练:对于无需移动的操作,训练截尾正态分布模型,生成时间间隔参数;对于需要移动的操作,提取聚类特征和匹配特征,构建训练集;(3)操作合成与模拟:对于无需移动的操作,使用截尾正态分布模型构造模拟操作的消息序列;对于需要移动的操作,使用聚类模型和分类模型,匹配出一个样本作为模板;合成出符合待模拟操作的要求参数的合成操作序列。本发明以超过70%的成功率通过现有技术文献实现的基于该操作构建的身份认证模型。

    一种暗网数据采集与抽取系统及方法

    公开(公告)号:CN107808000A

    公开(公告)日:2018-03-16

    申请号:CN201711115185.0

    申请日:2017-11-13

    Abstract: 本发明涉及一种暗网数据采集与抽取系统及方法,包括依次连接的暗网站点发现模块、暗网数据爬取模块、页面解析与内容抽取模块、数据融合与存储模块;暗网站点发现模块获取多源数据中的暗网url;暗网数据爬取模块配置Tor服务,修改Nutch的配置,使其与socks协议交互,进行数据的爬取;页面解析与内容抽取模块进行页面解析、页面向量化、特征码生成、相似度计算与模板集更新、页面内容抽取;数据融合与存储模块采用数据对齐策略对抽取得到的内容重组,将内容相近的数据记录融合存入数据库中。本发明实现了完整的页面保存到内容抽取的系统设计流程,为暗网中违法交易活动的发现与暗网知识图谱的建立提供数据支撑。

    传感器网络异常数据检测方法与系统

    公开(公告)号:CN106792883A

    公开(公告)日:2017-05-31

    申请号:CN201710047973.4

    申请日:2017-01-20

    CPC classification number: H04W24/08 H04W84/18

    Abstract: 本发明公开一种传感器网络异常数据检测方法,包括步骤:获取传感器网络的监测数据;根据数据的空间相关性特征,对所述监测数据进行空间相关检测,获得其中的异常数据;根据数据的时间相关性特征,对所述监测数据进行时间相关检测,获得其中的异常数据;针对任一异常数据,结合所述空间相关检测及所述时间相关检测的检测结果,判断该异常数据是事件数据或恶意数据。本发明可实时检测传感器网络中的异常数据,并对检测出的异常数据进行准确鉴别。

    社交网络用户关系采集系统及方法

    公开(公告)号:CN106384292A

    公开(公告)日:2017-02-08

    申请号:CN201610823149.9

    申请日:2016-09-14

    CPC classification number: G06Q50/01 G06F16/951

    Abstract: 本发明公开了一种社交网络用户关系采集系统与方法,该系统包括:分布式爬虫模块与任务队列模块。其中,任务队列模块包含爬取优先级依次增加的Super队列、Normal队列、Big队列。分布式爬虫模块用于将用户ID按照关系网规模从小到大的顺序分别存放在Normal队列、Big队列、Super队列,并按照所述爬取优先级爬取用户关系数据。本发明根据关系网规模将任务进行等级划分,不同等级的任务按照不同的执行优先级爬取,这样不仅具有控制爬取层数的功能,还可以保证关系网爬取时能够快速收敛。

Patent Agency Ranking