保护隐私的WEB网页有害内容检测方法和系统

    公开(公告)号:CN119577523A

    公开(公告)日:2025-03-07

    申请号:CN202510130013.9

    申请日:2025-02-05

    Abstract: 保护隐私的WEB网页有害内容检测方法和系统,该方法包括:配置有害信息集合;发送访问网络的申请请求;基于申请请求构建至少一个哈希函数对的学习型布隆过滤器进行训练,拆分训练后的每个哈希函数对,将拆分的深层哈希函数和验证数组存储于数据库,响应于申请请求反馈拆分的表层哈希函数;获取网络网页的应答生成并发送表层哈希值集合进行有害内容检测;响应于表层哈希值集合的检测结果进行相应处理。本发明通过构建布隆过滤器并设置哈希函数对对关键词的表层哈希值集合进行检测,不涉及明文数据,传输不可逆的检测结果,无法还原明文数据,保护了用户隐私;还通过降低验证数组长度,提高了检测的效率、有效性与准确性。

    AI代码缺陷修复数据集构建方法、缺陷修复方法及设备

    公开(公告)号:CN119938492A

    公开(公告)日:2025-05-06

    申请号:CN202411861567.8

    申请日:2024-12-17

    Abstract: 本申请提供一种AI代码缺陷修复数据集构建方法、缺陷修复方法及设备。数据集构建方法,包括:获取多组初始AI代码数据;每组初始AI代码数据分别包括缺陷数据和对应的修复数据;对多组初始AI代码数据进行变异处理;每组变异AI代码数据包括变异缺陷数据和对应的变异修复数据;对多组初始AI代码数据和多组变异AI代码数据分别进行去重和上下文提取处理,得到多组AI代码片段;依据CWE标准对多组AI代码片段进行分类和标注,得到多组结构化的AI代码片段;对多组结构化的AI代码片段进行预处理,以使多组结构化的AI代码数据对应的数据格式一致;将预处理后的每组结构化的AI代码片段,分别生成思维链数据,得到AI代码数据集。

Patent Agency Ranking