AI代码缺陷修复数据集构建方法、缺陷修复方法及设备

    公开(公告)号:CN119938492A

    公开(公告)日:2025-05-06

    申请号:CN202411861567.8

    申请日:2024-12-17

    Abstract: 本申请提供一种AI代码缺陷修复数据集构建方法、缺陷修复方法及设备。数据集构建方法,包括:获取多组初始AI代码数据;每组初始AI代码数据分别包括缺陷数据和对应的修复数据;对多组初始AI代码数据进行变异处理;每组变异AI代码数据包括变异缺陷数据和对应的变异修复数据;对多组初始AI代码数据和多组变异AI代码数据分别进行去重和上下文提取处理,得到多组AI代码片段;依据CWE标准对多组AI代码片段进行分类和标注,得到多组结构化的AI代码片段;对多组结构化的AI代码片段进行预处理,以使多组结构化的AI代码数据对应的数据格式一致;将预处理后的每组结构化的AI代码片段,分别生成思维链数据,得到AI代码数据集。

Patent Agency Ranking