-
公开(公告)号:CN110704694A
公开(公告)日:2020-01-17
申请号:CN201910936020.2
申请日:2019-09-29
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: G06F16/901 , G06F16/906 , G06K9/62
Abstract: 本发明公开了一种基于网络表示学习的组织层级划分方法及其应用,该方法包括以下步骤:基于层次拓扑结构特征的网络节点表示学习方法,获得节点向量表示;将得到的节点向量表示作为聚类算法的输入,通过节点相似性聚类算法得到节点的层级划分结果。本发明实现节点表示的位置无关性,使得节点的表示更加准确,组织层级划分结果也会更加准确。
-
公开(公告)号:CN110609857A
公开(公告)日:2019-12-24
申请号:CN201910811085.4
申请日:2019-08-30
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: G06F16/2458 , G06Q40/04
Abstract: 本发明属于数据处理技术领域,涉及一种序列模式的挖掘方法。该方法包括:利用时间窗口对原始序列进行划分,形成时间序列集;扫描时间序列集,获取一项式集合;根据频繁一项式定义采用动态阈值对一项式进行筛选,将非频繁的项从序列集中删除,得到频繁一项式集;从频繁一项式集中的第一项开始以所述的第一项为前缀构造后缀,对后缀进行频繁多项式的挖掘,满足频繁多项式定义的项为频繁项,当后缀为空时,挖掘结束;遍历频繁一项式集合,迭代进行上一步操作,直到频繁一项式集合被遍历完成,得到频繁项集合。本发明的方法,在识别频繁一项式时,采用了动态变化的支持度阈值;不仅对不同序列之间频繁出现的模式进行挖掘,也挖掘一个序列内部频繁出现的模式。
-
公开(公告)号:CN110363586A
公开(公告)日:2019-10-22
申请号:CN201910594639.X
申请日:2019-07-03
Applicant: 哈尔滨工业大学(威海) , 哈工大(威海)创新创业园有限责任公司
IPC: G06Q30/02 , G06F16/951 , G06F16/34 , G06F16/36
Abstract: 本发明公开了一种面向情报分析的人机交互系统及其数据处理方法,所述系统包括人机交互界面、数据输入模块、数据获取模块、数据处理模块、数据分析模块、结果展示模块,所述数据输入模块用于为用户提供输入接口;所述数据获取模块采用信息爬取方式获取情报信息,数据获取方式包括但不限于通用搜索、新闻搜索、社交搜索、论坛搜索、本地搜索、暗网搜索、学者搜索、企业搜索;所述数据处理模块用于对获取的情报信息进行数据处理,提高情报信息的质量,并保存处理结果;所述数据分析模块用于深入挖掘情报,并将挖掘结果交给结果展示模块进行可视化展示。本发明实现数据处理可视化,提高情报分析的准确性。
-
公开(公告)号:CN110362678A
公开(公告)日:2019-10-22
申请号:CN201910481863.8
申请日:2019-06-04
Applicant: 哈尔滨工业大学(威海) , 哈工大(威海)创新创业园有限责任公司
Abstract: 本发明公开了一种自动提取中文文本关键词的方法与装置,该方法包括:首先对文本进行中文分词和去除停用词;然后将单词转化为词向量,然后统计词频,通过词频和词语相似度计算单词在文本中的权重;然后构建基于图模型的文本排序算法,多次迭代计算出顶点得分;并且每次迭代计算过程中对关键词合并,并在图模型中添加新顶点并计算得分,然后对顶点得分进行排序,得分最大的为文本中最重要的关键词,本发明可实现中文文本关键词的准确提取。
-
公开(公告)号:CN109189519A
公开(公告)日:2019-01-11
申请号:CN201810837024.0
申请日:2018-07-26
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明提供通用的用户桌面行为模拟系统及方法,通过采集和分析用户行为,挖掘用户行为中蕴含的软件操作知识,构建用户行为的表述模型,从而实现智能自动化的桌面行为脚本生成,提供软件自动化使用和模拟指定真实用户桌面行为的功能。针对网络靶场和测试床中对逼真用户行为模拟和桌面环境下执行自动化软件操作、智能脚本生成的需求,提供了一种通用的用户桌面行为模拟系统及方法。该系统能够精确采集所需行为数据,既可以高度复现用户的历史行为,又可以挖掘用户行为蕴含的软件操作知识,从而实现自动化操作、脚本生成和用户桌面行为模拟。
-
公开(公告)号:CN107908300A
公开(公告)日:2018-04-13
申请号:CN201711148377.1
申请日:2017-11-17
Applicant: 哈尔滨工业大学(威海)
IPC: G06F3/0354 , G06F9/455 , G06F17/30
Abstract: 本发明涉及一种用户鼠标行为的合成与模拟方法及系统,包括:(1)数据采集与处理:实时采集用户的原始鼠标数据,分割、清洗后,存入历史操作数据库;(2)模型训练:对于无需移动的操作,训练截尾正态分布模型,生成时间间隔参数;对于需要移动的操作,提取聚类特征和匹配特征,构建训练集;(3)操作合成与模拟:对于无需移动的操作,使用截尾正态分布模型构造模拟操作的消息序列;对于需要移动的操作,使用聚类模型和分类模型,匹配出一个样本作为模板;合成出符合待模拟操作的要求参数的合成操作序列。本发明以超过70%的成功率通过现有技术文献实现的基于该操作构建的身份认证模型。
-
公开(公告)号:CN107808000A
公开(公告)日:2018-03-16
申请号:CN201711115185.0
申请日:2017-11-13
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: G06F17/30
Abstract: 本发明涉及一种暗网数据采集与抽取系统及方法,包括依次连接的暗网站点发现模块、暗网数据爬取模块、页面解析与内容抽取模块、数据融合与存储模块;暗网站点发现模块获取多源数据中的暗网url;暗网数据爬取模块配置Tor服务,修改Nutch的配置,使其与socks协议交互,进行数据的爬取;页面解析与内容抽取模块进行页面解析、页面向量化、特征码生成、相似度计算与模板集更新、页面内容抽取;数据融合与存储模块采用数据对齐策略对抽取得到的内容重组,将内容相近的数据记录融合存入数据库中。本发明实现了完整的页面保存到内容抽取的系统设计流程,为暗网中违法交易活动的发现与暗网知识图谱的建立提供数据支撑。
-
公开(公告)号:CN107205244A
公开(公告)日:2017-09-26
申请号:CN201610157704.9
申请日:2016-03-18
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明涉及信息通信领域,公开了一种基于时空相关性的传感器网络异常数据检测的设计方法,包括了空间维度检测和时间维度检测,可以实现无线传感器网络中异常数据的检测和分类,通过检测和分类结果,可以对网络中发生的事件进行及时响应,同时对于通过发送恶意数据来影响基站观测结果,从而降低网络可靠性的恶意节点,可以通过降低其在网络中的信誉度,使数据不从恶意节点转发,若节点信誉低至某一程度,将该节点拉入黑名单,不再接收其数据,以达到屏蔽此类恶意节点,维护网络安全的目的。
-
公开(公告)号:CN106792883A
公开(公告)日:2017-05-31
申请号:CN201710047973.4
申请日:2017-01-20
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明公开一种传感器网络异常数据检测方法,包括步骤:获取传感器网络的监测数据;根据数据的空间相关性特征,对所述监测数据进行空间相关检测,获得其中的异常数据;根据数据的时间相关性特征,对所述监测数据进行时间相关检测,获得其中的异常数据;针对任一异常数据,结合所述空间相关检测及所述时间相关检测的检测结果,判断该异常数据是事件数据或恶意数据。本发明可实时检测传感器网络中的异常数据,并对检测出的异常数据进行准确鉴别。
-
公开(公告)号:CN106384292A
公开(公告)日:2017-02-08
申请号:CN201610823149.9
申请日:2016-09-14
Applicant: 哈尔滨工业大学(威海)
CPC classification number: G06Q50/01 , G06F16/951
Abstract: 本发明公开了一种社交网络用户关系采集系统与方法,该系统包括:分布式爬虫模块与任务队列模块。其中,任务队列模块包含爬取优先级依次增加的Super队列、Normal队列、Big队列。分布式爬虫模块用于将用户ID按照关系网规模从小到大的顺序分别存放在Normal队列、Big队列、Super队列,并按照所述爬取优先级爬取用户关系数据。本发明根据关系网规模将任务进行等级划分,不同等级的任务按照不同的执行优先级爬取,这样不仅具有控制爬取层数的功能,还可以保证关系网爬取时能够快速收敛。
-
-
-
-
-
-
-
-
-