-
公开(公告)号:CN102254040A
公开(公告)日:2011-11-23
申请号:CN201110232192.5
申请日:2011-08-15
Applicant: 哈尔滨工业大学
IPC: G06F17/30
Abstract: 本发明提供了一种基于支撑向量机的Web划分方法,本发明的方法:将所有Web站点划分为N组;取K=1,2,3…N,对每个K的值,选取其中第1~K-1,K+1~N组Web站点样本,进行对LibSvm训练初始化;进行LibSVM训练;存储训练好的SVM模型;选取第K组Web站点样本,进行Web划分测试;Web划分测试结果保存。本发明SVM泛化能力强,在处理噪音较大数据时能够很好容错和分类。通过网络坐标系统建立的坐标准确率在80%左右,SVM可以解决非线性分类问题,SVM分类个数固定,避免网站没有爬虫爬取的极端情况,用分类算法克服了聚类算法中划分集合个数的不确定性。
-
公开(公告)号:CN102035677A
公开(公告)日:2011-04-27
申请号:CN201010581791.3
申请日:2010-12-10
Applicant: 哈尔滨工业大学
Abstract: 一种在比特流(BitTorrent)文件共享网络中基于资源占用的主动传播控制方法,在该方法中,将控制管理节点伪装成合法的共享节点与其他共享节点进行交互,通过该控制管理节点对其他共享节点的比特流客户端的版本进行识别,选择相应于所识别版本的客户端的控制策略,该控制策略用于主动侵占其他共享节点的连接或者带宽资源。本发明的方法能够在BitTorrent文件共享传播过程中,限制共享用户的下载或上传能力,使得参与整个共享文件下载过程的所有节点下载变得极为缓慢,甚至无法下载。采用本发明所述的面向BitTorrent网络的文件共享传播控制技术,从控制管理的角度达到了共享文件的传播过程或下载时间尽可能延长、控制管理所付出的资源或代价尽可能少的技术效果。
-
公开(公告)号:CN101820357A
公开(公告)日:2010-09-01
申请号:CN201010109333.X
申请日:2010-02-11
Applicant: 哈尔滨工业大学
IPC: H04L12/24
Abstract: 网络安全事件可视化系统,涉及到网络安全事件可视化技术领域。本发明解决了现有网络安全事件可视化技术不适用于大规模网络系统的问题。本发明中采用数据获取模块主动测量获得网络的物理连接状况来获得拓扑数据、异常数据和whois定位库信息,并形成网络拓扑图;采用拓扑数据的分簇模块将拓扑数据进行分簇处理,并为每个为簇的中心分配唯一的标识;采用异常数据的坐标映射模块将异常数据的坐标映射到网络拓扑图上,并标示异常事件对应的点;采用网络拓扑图的优化模块将标示有异常事件的网络拓扑图进行划分、优化,使各个簇之间均匀;采用受力布局控制模块将网络拓扑图根据受力平衡的原则进行摆放、布局;采用可视化模块将布局后的拓扑图进行可视化。
-
公开(公告)号:CN101808084A
公开(公告)日:2010-08-18
申请号:CN201010109449.3
申请日:2010-02-12
Applicant: 哈尔滨工业大学
IPC: H04L29/06
Abstract: 一种大规模网络安全事件模拟与仿真方法及控制方法,涉及网络安全事件仿真领域。解决了现有的网络安全模拟系统存在无法进行全面的安全事件模拟的问题。具体步骤如下:A、根据拓扑数据进行链路带宽和延迟的估算,获得路由节点的连接关系文件,将安全事件文件的格式转换;B、根据拓扑和并行模拟的粒度,对路由节点的连接关系文件进行划分,使其能够部署在多机并行的环境下进行并行模拟,并根据划分结果更新相应的拓扑数据文件;C、按照相应的规则生成并行模拟可用的模拟脚本,不同模拟节点上的模拟脚本相同,每个节点读取与自己有关的部分脚本,共同完成模拟任务。本发明适用于大规模的网络安全事件模拟。
-
公开(公告)号:CN119272770B
公开(公告)日:2025-05-16
申请号:CN202411190943.5
申请日:2024-08-28
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/16 , G06N3/045 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于注意力机制优化的网络数据命名实体识别方法,属于命名实体识别的预训练模型优化技术领域。解决了现有技术中传统的网络数据命名实体识别方法因未考虑网络安全数据特点导致的识别结果精度较低的问题;本发明给定输入序列,将其输入BERT模型,生成三种嵌入并进行相加,得到词的最终输入,输入到引入BERT模型的Transformer‑XL模型,设置基础矩阵,引入内容嵌入矩阵和位置嵌入矩阵,得到内容嵌入基础矩阵和位置嵌入基础矩阵;获得句子中任意两个单词之间的注意力机制分数,对所有注意力机制分数的加和进行归一化,得到归一化后的注意力机制分数。本发明有效提升了命名实体识别的精度,可以应用于实体识别。
-
公开(公告)号:CN119996065A
公开(公告)日:2025-05-13
申请号:CN202510401906.2
申请日:2025-04-01
Applicant: 哈尔滨工业大学
IPC: H04L9/40 , H04L61/4511 , G06N3/088
Abstract: 本发明公开了一种DNS隧道检测方法,属于安全通信技术领域。解决了现有技术中传统的DNS隧道检测方法难以检测低吞吐DNS隧道和分布式DNS隧道的问题;本发明使用设定的第一聚合键对数据包进行聚合,并使用自编码器进行初步检测与评分,对常规DNS隧道进行检测;使用设定的第二聚合键和第三聚合键分别对一阶聚合的元数据再次进行聚合,分别从通信对象与域名维度对低吞吐DNS隧道和分布式DNS隧道进行检测;将三个自编码器的评分送入一个作为非线性投票机制的自编码器,最后非线性投票机制根据三个聚合键下数据的评分做出最终判断,得到检测结果。本发明有效提升了DNS隧道检测的全面性,可以应用于检测分布式DNS隧道。
-
公开(公告)号:CN119272770A
公开(公告)日:2025-01-07
申请号:CN202411190943.5
申请日:2024-08-28
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/16 , G06N3/045 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于注意力机制优化的网络数据命名实体识别方法,属于命名实体识别的预训练模型优化技术领域。解决了现有技术中传统的网络数据命名实体识别方法因未考虑网络安全数据特点导致的识别结果精度较低的问题;本发明给定输入序列,将其输入BERT模型,生成三种嵌入并进行相加,得到词的最终输入,输入到引入BERT模型的Transformer‑XL模型,设置基础矩阵,引入内容嵌入矩阵和位置嵌入矩阵,得到内容嵌入基础矩阵和位置嵌入基础矩阵;获得句子中任意两个单词之间的注意力机制分数,对所有注意力机制分数的加和进行归一化,得到归一化后的注意力机制分数。本发明有效提升了命名实体识别的精度,可以应用于实体识别。
-
公开(公告)号:CN115134251B
公开(公告)日:2025-01-07
申请号:CN202210761664.4
申请日:2022-06-30
Applicant: 哈尔滨工业大学
IPC: H04L41/12 , H04L41/0823 , H04L43/0823 , H04L61/4552 , H04L61/5007 , H04L67/06 , H04L67/30
Abstract: 一种跨境云内部地理边界发现系统及方法,涉及网络拓扑探测技术领域。本发明的技术要点包括:在正常拓扑探测的基础上,针对云本身的特点进行优化,其中:前缀选取即根据云流量传输的特点选择能够较多的发现云内部地理边界的前缀进行探测,减少了探测目标数量;云地理边界识别即对于探测结果能够快速准确的分析出其中云内部的地理边界,减少了分析时间;测量状态监控即时刻监控测量点状态,观察其是否异常掉线并做出相应处理。本发明在极大程度减少了测量目标及测量时间的基础上,提高了云内部地理边界的发现率。
-
公开(公告)号:CN118734846A
公开(公告)日:2024-10-01
申请号:CN202410745744.X
申请日:2024-06-11
Applicant: 哈尔滨工业大学
IPC: G06F40/284 , G06F40/216 , G06F16/33 , G06F16/335 , G06F16/35 , G06Q50/18
Abstract: 本发明提出一种法律文本知识提取方法,属于法律文本知识提取技术领域。包括:对待提取文本进行分词操作,将每个类别中的所有文档聚合成一个长文本,过滤法律停用词,生成每个类别关键词集合;搜索每个类别中与原类别共有关键词最多的相似类别加入关键词集合中;筛选每个类别和其相似类别中的独有关键词和共有关键词加入关键词集合中,以及筛选独有关键词和共有关键词中的偏置词加入关键词集合中。为了解决缺少法律领域的知识提取法方法的问题,本发明分别给出了基于人工干涉的知识提取方案以及无需人工干涉的自动化知识提取方案,对准确性和效率需求不同的场景提供个性化解决方案。
-
公开(公告)号:CN118733767A
公开(公告)日:2024-10-01
申请号:CN202410745742.0
申请日:2024-06-11
Applicant: 哈尔滨工业大学
IPC: G06F16/35 , G06F16/33 , G06F16/335 , G06F40/216 , G06F40/284 , G06F18/214
Abstract: 本发明提出一种基于可解释扰动策略的中文法律对抗文本生成方法,属于对抗文本生成技术领域。包括:对法律文本进行法律知识提取;基于法律知识为文本中每个词语的重要性进行打分并排序;为待添加扰动的文本选择需要执行的扰动策略;执行扰动策略生成法律对抗文本。本发明解决了现有技术中存在缺少面向法律罪名分类任务的对抗文本生成方法的技术问题。本发明首先提取每类罪名的主要特征作为先验知识,然后将先验知识与强化相似标签和弱化原标签两种扰动策略结合,通过强化与原标签相似的标签的独有特征或弱化原标签自身的独有特征来生成对抗文本,这使得对抗文本的生成过程具有可解释性。
-
-
-
-
-
-
-
-
-