-
公开(公告)号:CN119938492A
公开(公告)日:2025-05-06
申请号:CN202411861567.8
申请日:2024-12-17
IPC: G06F11/362 , G06F11/3668 , G06N20/00
Abstract: 本申请提供一种AI代码缺陷修复数据集构建方法、缺陷修复方法及设备。数据集构建方法,包括:获取多组初始AI代码数据;每组初始AI代码数据分别包括缺陷数据和对应的修复数据;对多组初始AI代码数据进行变异处理;每组变异AI代码数据包括变异缺陷数据和对应的变异修复数据;对多组初始AI代码数据和多组变异AI代码数据分别进行去重和上下文提取处理,得到多组AI代码片段;依据CWE标准对多组AI代码片段进行分类和标注,得到多组结构化的AI代码片段;对多组结构化的AI代码片段进行预处理,以使多组结构化的AI代码数据对应的数据格式一致;将预处理后的每组结构化的AI代码片段,分别生成思维链数据,得到AI代码数据集。
-
公开(公告)号:CN119940475A
公开(公告)日:2025-05-06
申请号:CN202411851758.6
申请日:2024-12-16
IPC: G06N3/098 , G06N3/096 , G06N5/04 , G06V10/82 , G06V10/764
Abstract: 一种利用高阶子模型辅助训练的联邦学习方法及装置,该方法通过集成多高阶子模型的决策信息,增强低阶子模型的推理准确率;低阶子模型可以借助高阶子模型的决策信息和基于特征距离的最高阶子模型的量化矩阵辅助训练,提高训练效果;通过降低目标类别置信度的目标损失(信息熵)优化低阶子模型,避免了传统自蒸馏中再次拟合高阶子模型的目标类别置信度引起的信息偏移问题;利用对比学习统一各级子模型的特征维度,构建基于特征距离的最高阶子模型的量化矩阵作为监督信息,通过最小化低阶子模型与最高阶子模型距离矩阵的分布差异,引导低阶子模型接近最高阶子模型的量化矩阵,指导低阶子模型挖掘不同图像中的语义关系,提高模型的泛化能力。
-