一种移动应用程序代码提交故障预测模型的可解释性方法

    公开(公告)号:CN114880206A

    公开(公告)日:2022-08-09

    申请号:CN202210038845.4

    申请日:2022-01-13

    Applicant: 南通大学

    Abstract: 本发明提供了一种移动应用程序代码提交故障预测模型的可解释性方法,包括以下步骤:(1)通过挖掘版本控制系统,搜集来自移动应用程序项目内的代码提交,随后对代码提交进行度量和标注,形成数据集;(2)根据数据集,借助随机森林构建出移动应用程序代码提交故障预测模型;(3)当面对新的代码提交时,对该代码提交进行度量,然后输入到代码提交故障预测模型中,得到预测结果;(4)对局部可解释性技术LIME进行超参优化,使用超参优化的LIME方法ExplainApp生成该预测结果的解释。本发明的有益效果为:预测出新的代码提交是否会引入故障,同时可以给出相应的高质量解释,辅助开发人员完成后续故障的理解、定位和修复。

    一种移动应用程序代码提交故障预测模型的可解释性方法

    公开(公告)号:CN114880206B

    公开(公告)日:2024-06-11

    申请号:CN202210038845.4

    申请日:2022-01-13

    Applicant: 南通大学

    Abstract: 本发明提供了一种移动应用程序代码提交故障预测模型的可解释性方法,包括以下步骤:(1)通过挖掘版本控制系统,搜集来自移动应用程序项目内的代码提交,随后对代码提交进行度量和标注,形成数据集;(2)根据数据集,借助随机森林构建出移动应用程序代码提交故障预测模型;(3)当面对新的代码提交时,对该代码提交进行度量,然后输入到代码提交故障预测模型中,得到预测结果;(4)对局部可解释性技术LIME进行超参优化,使用超参优化的LIME方法ExplainApp生成该预测结果的解释。本发明的有益效果为:预测出新的代码提交是否会引入故障,同时可以给出相应的高质量解释,辅助开发人员完成后续故障的理解、定位和修复。

    一种使用CodeT5模型和提示微调的源代码漏洞预测方法

    公开(公告)号:CN116910760A

    公开(公告)日:2023-10-20

    申请号:CN202310615838.0

    申请日:2023-05-29

    Applicant: 南通大学

    Abstract: 本发明提供了一种使用CodeT5模型和提示微调的源代码漏洞检测方法,属于计算机技术领域,解决了传统的漏洞检测模型中检测准确率不高的技术问题。包括以下步骤:S1:从中收集开源项目的C和C++源代码,构成数据集;S2:对数据集进行预处理;S3:对构建的数据集随机划分成训练集、验证集和测试集;S4:使用hard soft方式创建为漏洞检测任务定制的提示模板;S5:创建为漏洞检测任务定制的Verbalizer;S6:训练集训练分类器;S7:对测试集进行最终结果预测。本发明的有益效果为:使用基于提示微调的预训练模型CodeT5进行漏洞检测,从而提高漏洞检测的性能。

    基于预训练模型T5的编程问答帖子标题自动补全方法

    公开(公告)号:CN116738976A

    公开(公告)日:2023-09-12

    申请号:CN202310050161.0

    申请日:2023-02-01

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于预训练模型T5的编程问答帖子标题自动补全方法,属于计算机技术领域,解决了开发人员不能很好的总结提炼问题帖标题,导致标题质量低而不能及时得到有效回复的问题。其技术方案为:包括以下步骤:(1)搜集高质量问题贴;(2)语料库的构建及预处理;(3)标题补全模型的构建;(4)标题补全模型的应用。本发明的有益效果为:减少开发人员编写标题时所需的时间和精力,帮助他们编写更高质量的标题。

    基于提示微调的软件漏洞严重程度预测方法

    公开(公告)号:CN118965357A

    公开(公告)日:2024-11-15

    申请号:CN202410970776.X

    申请日:2024-07-19

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于提示微调的软件漏洞严重程度预测方法,属于计算机技术领域,包括以下步骤:S1:搜集处理漏洞严重程度预测相关数据集。S2:按9:1的比例划分为训练集和验证集,借助分层采样方法保证两者严重程度分布一致;S3:设计混合提示模板及映射方法,将源代码和漏洞描述融合,输入到CodeT5进行模型和提示模板训练;S4:训练时采用早停策略防止过拟合,并返回最优的模型和提示模板;S5:对需要预测的软件漏洞,借助混合提示模板融合源代码和漏洞描述,输入模型并完成严重程度的预测。本发明的有益效果为:借助提示微调和源代码与漏洞描述的融合,不需要大量训练数据,即可完成高质量漏洞严重程度预测模型的构建。

    融合多维度特征的多目标代码提交缺陷倾向性预测方法

    公开(公告)号:CN117608998A

    公开(公告)日:2024-02-27

    申请号:CN202211723126.2

    申请日:2022-12-30

    Applicant: 南通大学

    Abstract: 本发明提供了一种融合多维度特征的多目标代码提交缺陷倾向性预测方法,属于计算机技术领域。解决了多目标缺陷预测模型中特征提取部分缺乏语义特征的问题,使得模型获得更多的代码特征信息。其技术方案为:包括以下步骤:S1:抽取代码提交变更信息和提交日志消息;S2:使用CodeBert提取语义特征,并使用CommitGuru提取专家特征;S3:构建基于多目标优化的帕累托最优解集;S4:基于验证集,从帕累托最优解集中选出最优模型;S5:使用最优模型来预测一个新的代码提交是否引入缺陷。本发明的有益效果为:将专家特征和语义特征进行融合,从而提高缺陷预测的质量和可靠性。

    一种基于提示学习和数据增强的API补全方法

    公开(公告)号:CN116483337A

    公开(公告)日:2023-07-25

    申请号:CN202310445624.3

    申请日:2023-04-24

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于提示学习和数据增强的API补全方法,属于计算机领域。解决了基于生成技术的API推荐模型预测能力有限和用于API推荐的训练数据不足的问题。其技术方案为:包括以下步骤:S1:语料库预处理并构造提示前缀;S2:构建预训练模型CodeT5和ATCom对抗训练方法;S3:在模型嵌入层使用ATCom,生成多组对抗样本;S4:利用原语料库和生成的对抗样本微调CodeT5并生成完整的API。本发明的有益效果为:根据不完整的API前缀和提示信息进行API补全,提高开发人员的效率和编程体验,通过对抗样本的训练,增强模型的鲁棒性,提高模型的泛化能力,从而提高API补全的准确性和稳定性。

Patent Agency Ranking