在多个标签页并发访问场景下的暗网网站识别方法及装置

    公开(公告)号:CN115879032A

    公开(公告)日:2023-03-31

    申请号:CN202211448375.5

    申请日:2022-11-18

    Applicant: 清华大学

    Abstract: 本发明公开了在多个标签页并发访问场景下的暗网网站识别方法及装置,其中,该方法包括:获取待识别网站被浏览的网络流量包,并提取网络流量包中的方向序列特征;基于多滑动窗口将方向序列特征划分为多个子序列特征,将多个子序列特征输入神经网络模型提取得到预设模式特征;利用目标网站识别模型对预设模式特征的相关性进行分析,以得到目标网站被访问的概率计算结果;基于概率计算结果和预设的分类模型,得到待识别网站中的目标网站识别结果。本发明能够在混淆的暗网流量中有效提取被访问的暗网网站的关键信息,实现多个标签页的网站准确识别,并且在动态和防御场景下具有较好的鲁棒性。

Patent Agency Ranking