一种基于增量聚类算法的在线流量识别方法

    公开(公告)号:CN109067612A

    公开(公告)日:2018-12-21

    申请号:CN201810769817.3

    申请日:2018-07-13

    CPC classification number: H04L43/026 G06K9/6223 H04L43/028 H04L43/062

    Abstract: 本发明属于网络技术领域,具体涉及一种基于增量聚类算法的在线流量识别方法。包括离线识别阶段和在线识别阶段,离线识别阶段将预先准备的训练数据集使用基于改进K均值算法的半监督学习流量算法进行初步的聚类和映射工作,得到初步分类完成的数据集;在线识别阶段基于离线识别阶段所形成的已完成聚类和映射的数据集,对在线新加入的数据流进行增量聚类来判断其网络应用类型,从而达到流量识别的目的。本方法基于机器学习技术,通过构建合适的识别模型对预先准备的数据进行学习,可以实时对在线流量进行增量聚类,结合预先准备的训练集进行初步的半监督分类,可以实现网络流量的在线识别,具有良好的实时性和较高的识别率。

    基于分段的自适应动态调整线程池大小的方法

    公开(公告)号:CN108874537A

    公开(公告)日:2018-11-23

    申请号:CN201810508398.8

    申请日:2018-05-24

    Abstract: 本发明提供的是一种基于分段的自适应动态调整线程池大小的方法。一,配置线程池动态改变大小的上限Tmax和下限Tmin;二,如果用户请求数量处于上升阶段,使用调整因子向上调线程池的大小;三,如果用户请求数量处于平稳阶段,当用户的请求数大于线程池中的工作线程数量时,以用户请求量为调整线程池大小的目标;四,如果用户请求数量处于下降阶段,使用调整因子向下调线程池的大小;五,线程池大小调整分别同上限Tmax和下限Tmin比较,大于Tmax时,使用Tmax作为线程池大小;小于Tmin时,使用Tmin作为线程池的大小。本发明通过监测线程池的状态并对线程池的尺寸进行调整,最大限度地满足用户的需求。

    基于网络行为特征聚类分析的恶意代码检测方法

    公开(公告)号:CN108769001A

    公开(公告)日:2018-11-06

    申请号:CN201810508399.2

    申请日:2018-05-24

    CPC classification number: H04L63/1416 G06K9/6223 H04L63/145

    Abstract: 本发明提供的是一种基于网络行为特征聚类分析的恶意代码检测方法。步骤1,主要针对僵尸网络和木马的网络行为进行特征分析;步骤2,利用MFAM‑NB框架进行网络特征提取;步骤3,利用基于自适应权重的k‑Means聚类算法进行恶意代码检测。该方法能够解决恶意网络可以轻易地改变包内容和流特性,从而避开恶意代码的检测的问题,并且能够解决传统恶意代码检测方法对于手工特征提取的依赖性问题。该方法所采用的基于自适应权重的k‑Means恶意代码检测算法能够解决传统的k‑Means算法对于初始化中心选择不当导致恶意代码检测不准确的问题,并且能够解决k‑Means算法处理大数据量特征集过于耗时的问题。

    一种增强型室内无源被动人体定位方法

    公开(公告)号:CN105158727B

    公开(公告)日:2017-10-31

    申请号:CN201510340890.5

    申请日:2015-06-18

    Abstract: 本发明属于无线感知领域,具体涉及一种室内细粒度实时被动人体移动检测的增强型室内无源被动人体定位方法。本发明包括:数据采集:数据处理:利用线性变换方法,将随机相位转换为可用相位;特征值提取:人体移动检测。本发明提出一个室内细粒度实时被动人体移动检测方法,该方法可利用信道状态信息中的相位信息来实现人体移动检测。本方法中采用了消除随机噪音的相位信息,可以获得更加精确的检测性能。本发明研发了两种新的检测方法,这两种方法其检测阈值与具体环境无关,避免了因环境自身改变而需重新勘测的开销。这两种方法计算量较小,实时性较高。

    一种基于关键用户的微博信息传播预测方法

    公开(公告)号:CN106257459A

    公开(公告)日:2016-12-28

    申请号:CN201610629837.1

    申请日:2016-08-03

    Abstract: 本发明提供的是一种基于关键用户的微博信息传播预测方法。步骤1:数据采集;步骤2:数据处理;步骤3:利用线性模型预测;步骤4:基于关键用户挖掘的模型调整,进行后续预测。本发明的方法,利用从微博网络上获取的消息的用户转发数据,通过基于关键用户的动态线性模型来预测未来信息传播的状态,并在预测的过程中实时的挖掘关键用户,在新增关键用户的基础上对线性模型进行改进。

    一种面向邮件地址特征的邮件地址匹配方法

    公开(公告)号:CN106027369A

    公开(公告)日:2016-10-12

    申请号:CN201610300852.1

    申请日:2016-05-09

    CPC classification number: H04L51/28 H04L12/66 H04L51/22

    Abstract: 本发明提供的是一种面向邮件地址特征的邮件地址匹配方法。(1)按照构建过程,构建n条邮件地址规则;(2)随机生成一条邮件地址,将该邮件地址包括“@”符在内的“@”符之前的部分在AC自动机构建的规则树中,进行匹配;(3)将该地址“@”符之后的部分的域名部分,计算三种哈希函数的函数值,在哈希表中进行查找。本发明提出的基于动态存储的缓冲区方法,考虑了邮件地址的用户名部分数量较大,较为分散,且域名部分数量大但是种类比较少的特点,充分利用的多模式匹配算法和哈希算法的优势。能够在大规模邮件地址匹配时拥有良好的内存性能表现和时间性能变现。

    一种基于公共前缀的动态添加树节点和单元的模式匹配方法

    公开(公告)号:CN105871726A

    公开(公告)日:2016-08-17

    申请号:CN201610161030.X

    申请日:2016-03-21

    CPC classification number: H04L45/7453 H04L61/251 H04L61/6059

    Abstract: 本发明属于网络信息处理技术领域,具体涉及一种基于公共前缀的动态添加树节点和单元的模式匹配方法。本发明包括:(1)模式加载操作:当一条新的IP地址加入字典树时,先从树根节点开始查找;(2)网络地址查找操作:对于网络IP地址在字典树结构中的查找,在单元查找过程中,使用扇出宽度来选择横向查找的方法。与现有的方法相比,本发明提出了基于公共子串的动态添加树节点和单元方法,设计横向单元的查找方案,基于树纵向的压缩减少查找过程中内存的访问次数。

    一种基于微博用户质量的信息影响力评估方法

    公开(公告)号:CN105608625A

    公开(公告)日:2016-05-25

    申请号:CN201610003416.8

    申请日:2016-01-04

    CPC classification number: G06Q50/01

    Abstract: 本发明涉及社会网络数据挖掘领域,具体涉及一种基于微博用户质量的信息影响力评估方法。本发明包括数据采集;数据处理;用户质量计算;动态消息影响力计算。本发明提出一种基于微博用户质量的信息影响力评估方法,该技术主要考虑参与微博信息传播的用户质量,来对传统的影响力最大化问题进行改进。并取得了良好的影响效果。本发明能够有效的评估微博消息影响力,屏蔽机器人粉丝造成的虚假微博影响力。

    一种增强型室内无源被动人体定位方法

    公开(公告)号:CN105158727A

    公开(公告)日:2015-12-16

    申请号:CN201510340890.5

    申请日:2015-06-18

    CPC classification number: G01S1/08 G01V3/12

    Abstract: 本发明属于无线感知领域,具体涉及一种室内细粒度实时被动人体移动检测的增强型室内无源被动人体定位方法。本发明包括:数据采集:数据处理:利用线性变换方法,将随机相位转换为可用相位;特征值提取:人体移动检测。本发明提出一个室内细粒度实时被动人体移动检测方法,该方法可利用信道状态信息中的相位信息来实现人体移动检测。本方法中采用了消除随机噪音的相位信息,可以获得更加精确的检测性能。本发明研发了两种新的检测方法,这两种方法其检测阈值与具体环境无关,避免了因环境自身改变而需重新勘测的开销。这两种方法计算量较小,实时性较高。

    一种面向多实体稀疏关系的联合挖掘方法

    公开(公告)号:CN104915371A

    公开(公告)日:2015-09-16

    申请号:CN201510175590.6

    申请日:2015-04-14

    Abstract: 本发明属于智能信息处理领域,具体涉及一种利用计算机技术辅助网络信息智能分析和处理的面向多实体稀疏关系的联合挖掘方法。本发明包括:从异构数据中抽取实体、异质关系,两类实体之间的异质关系采用异质关系矩阵表示,进而构建异质关系矩阵集合R;对于每一个异质关系矩阵Ri进行非负矩阵分解;针对每一类实体对应的矩阵分解结果进行融合,得到最终的聚类指示矩阵。本发明在真实数据集上与最近的几种方法进行了对比分析,可知本方法在准确率、纯度、NMI和ARI四个度量指标下都整体优于其他算法。本方法只与规模较小一类的实体相关,因此在大规模数据上具有较好的可扩展性。

Patent Agency Ranking