一种用户侧流量数据分析的网站去匿名方法和系统

    公开(公告)号:CN113938290A

    公开(公告)日:2022-01-14

    申请号:CN202111031350.0

    申请日:2021-09-03

    Abstract: 本发明公开一种用户侧流量数据分析的网站去匿名方法和系统,属于网络信息安全领域。包括:将大量带标签的监控网站流量数据样本进行去冗余,将处理好的样本中每个会话的网站流量数据抽象压缩为流量突发序列,流量突发序列中的每个元素表示同一方向上连续发送或接收的数据包的数量,将该流量突发序列输入至深度学习模型中提取特征向量,并使用特征向量集构建分类器;从现实环境中采集网站流量数据样本,通过同样的处理方式抽象压缩为流量突发序列后,使用分类器鉴别网站的类别。本发明基于用户侧流量数据进行分析,客户端侧流量数据更加易于获取,更能反映真实的网络环境。采用Brust序列数据代替传统网络数据包,能够有效利用长序列数据的长距离信息。

    一种用户侧流量数据分析的网站去匿名方法和系统

    公开(公告)号:CN113938290B

    公开(公告)日:2022-11-11

    申请号:CN202111031350.0

    申请日:2021-09-03

    Abstract: 本发明公开一种用户侧流量数据分析的网站去匿名方法和系统,属于网络信息安全领域。包括:将大量带标签的监控网站流量数据样本进行去冗余,将处理好的样本中每个会话的网站流量数据抽象压缩为流量突发序列,流量突发序列中的每个元素表示同一方向上连续发送或接收的数据包的数量,将该流量突发序列输入至深度学习模型中提取特征向量,并使用特征向量集构建分类器;从现实环境中采集网站流量数据样本,通过同样的处理方式抽象压缩为流量突发序列后,使用分类器鉴别网站的类别。本发明基于用户侧流量数据进行分析,客户端侧流量数据更加易于获取,更能反映真实的网络环境。采用Brust序列数据代替传统网络数据包,能够有效利用长序列数据的长距离信息。

Patent Agency Ranking