一种基于集成学习的代码片段敏感信息检测方法

    公开(公告)号:CN117421730B

    公开(公告)日:2024-06-04

    申请号:CN202311163836.9

    申请日:2023-09-11

    Applicant: 暨南大学

    Abstract: 本发明公开了一种基于集成学习的代码片段敏感信息检测方法,包括S1、对训练样本进行预处理,初始化配置文件;S2、从训练样本中提取特征,建立特征矩阵;S3、建立SVM‑AdaBoost模型并对该模型进行训练;S4、用训练好的SVM‑AdaBoost模型检测待测代码片段,初步判断代码片段是否存在敏感信息,并对存在敏感信息对样本进行自动标记。本发明加强了代码片段中敏感信息的检测能力,减少了人工检测的成本,同时基于集成学习结合多个基学习器可以获得比任意单个基学习器都要好的检测效果。

    一种基于集成学习的代码片段敏感信息检测方法

    公开(公告)号:CN117421730A

    公开(公告)日:2024-01-19

    申请号:CN202311163836.9

    申请日:2023-09-11

    Applicant: 暨南大学

    Abstract: 本发明公开了一种基于集成学习的代码片段敏感信息检测方法,包括S1、对训练样本进行预处理,初始化配置文件;S2、从训练样本中提取特征,建立特征矩阵;S3、建立SVM‑AdaBoost模型并对该模型进行训练;S4、用训练好的SVM‑AdaBoost模型检测待测代码片段,初步判断代码片段是否存在敏感信息,并对存在敏感信息对样本进行自动标记。本发明加强了代码片段中敏感信息的检测能力,减少了人工检测的成本,同时基于集成学习结合多个基学习器可以获得比任意单个基学习器都要好的检测效果。

Patent Agency Ranking