-
公开(公告)号:CN104461867A
公开(公告)日:2015-03-25
申请号:CN201410623526.5
申请日:2014-11-08
Applicant: 南通大学
IPC: G06F11/36
Abstract: 本发明提出了一种软件演化过程故障分析方法,主要用于解决软件在不断演化过程中故障理解和分析问题,包括如下步骤:步骤1、使用AST分析器,构造演化修改程序的中间表示形式抽象语法树EFAGM_AST;步骤2、基于演化修改,确立EFAGM的关键修改节点集,依次构建修改节点集的前向和后向影响节点和路径;步骤3、根据计算EFAGM图节点的域,生成EFAGM的静态影响因子和动态影响因子,完成演化故障分析图模型EFAGM的构建;在故障发生时,采用EFAGM实现对程序演化修改引起的故障分析。本发明不仅可以表示演化修改影响元素及其之间的关系,而且能有效提高演化故障分析的效率。
-
公开(公告)号:CN115185732B
公开(公告)日:2025-05-02
申请号:CN202210849578.9
申请日:2022-07-19
Applicant: 南通大学
IPC: G06F11/07 , G06F8/75 , G06N3/0455 , G06N3/086 , G06N3/126
Abstract: 本发明提供了一种融合遗传算法和深度神经网络的软件缺陷预测方法,属于计算机技术领域,解决了自动缺陷预测中新的特征具有不确定性,会和预测结果有别的技术问题;其技术方案为:采用了结果优化的遗传算法选取数据集的特征,结合变分自编码器和最大均值差异距离,学习源项目和目标项目的共性特征,来训练可靠的缺陷预测模型。本发明的有益效果为:本发明的遗传算法结合贝叶斯算法替换传统遗传算法的随机变异过程,设计了新的适应度函数,减少了不必要的特征,通过多组数据集上与传统跨项目缺陷预测方法对比,表明本发明可以提高软件预测的有效性。
-
公开(公告)号:CN114238621B
公开(公告)日:2024-09-06
申请号:CN202111441323.0
申请日:2021-11-30
Applicant: 南通大学
IPC: G06F16/34 , G06F16/36 , G06F40/258 , G06F8/30
Abstract: 本发明提供了一种基于Transformer的编程问题帖标题自动生成方法,属于计算机应用技术领域;其技术方案为:包括以下步骤:(1)收集开发人员问答网站上与Java、C#、Python和JavaScript四种编程语言相关的问题帖,基于三种启发式规则以过滤掉其中的低质量问题帖;(2)基于上述构建的语料库,对构建的基于Transformer的T5模型进行微调,利用AdaFactor优化器以及注意力机制进行优化,构建出问题帖标题自动生成模型。本发明的有益效果为:为开发人员问答网站(例如Stack Overflow)的问题帖生成既简洁又准确的标题,实现了针对Java、C#、Python和JavaScript四种编程语言的问题帖标题生成的自动化。
-
公开(公告)号:CN113743064B
公开(公告)日:2024-09-06
申请号:CN202111060940.6
申请日:2021-09-10
Applicant: 南通大学
IPC: G06F40/169 , G06F8/41 , G06F18/2415 , G06N3/0464 , G06N3/0475 , G06N3/0455 , G06N3/094
Abstract: 本发明提供了一种基于决策的融合信息检索和深度学习的代码注释生成方法,包括以下步骤:(1)基于GitHub网站,挖掘高质量开源项目,搜集代码内的函数及其注释形成语料库,并划分成训练集和验证集;(2)构建基于信息检索的模型,通过融合语义、词法和语法相似度,在训练集中搜索出与目标代码段c最为相似的代码段csim,并复用其注释;(3)构建基于深度学习的模型,考虑对抗样本,并使用一种基于Transformer的模型生成代码注释;(4)在验证集上分析这两种模型的性能与两个代码段c和csim之间相似度分数的关系,确定相似度阈值;(5)当为一个新的目标代码生成注释时,根据决策模块输出对应的代码注释。本发明的有益效果为:可以生成高质量的代码注释。
-
公开(公告)号:CN118312438A
公开(公告)日:2024-07-09
申请号:CN202410569009.8
申请日:2024-05-09
Applicant: 南通大学
Abstract: 本发明提供了一种基于代码结构知识微调的源代码漏洞检测方法,属于计算机技术领域,解决了深度神经网络模型在微调时不能充分的理解源代码的上下文和结构特征的技术问题。其技术方案为:包括以下步骤:S1:对数据集进行预处理和切分;S2:提取代码的抽象语法树;S3:将训练集中的代码片段输入到CodeT5模型中;S4:计算结构距离矩阵和注意力矩阵之间的sinkhorn距离,得到结构损失;S5:在微调阶段,使用多任务学习方法,联合结构损失和漏洞检测的目标函数来优化模型。S6:将测试集输入到已训练好的模型中进行二分类漏洞检测。本发明的有益效果为:提高源代码漏洞检测的准确性和可靠性。
-
公开(公告)号:CN114418033B
公开(公告)日:2024-05-24
申请号:CN202210170049.6
申请日:2022-02-24
Applicant: 南通大学
IPC: G06F18/2415 , G06F18/2431 , G06F18/214 , G06F40/211 , G06F40/284 , G06F40/30 , G06F16/35 , G06N3/08 , G06N3/0442 , G06N3/045
Abstract: 本发明提供了一种基于CodeBert的代码编程语言分类方法,属于计算机应用技术领域。其技术方案为:包括以下步骤:(1)对原始数据集进行处理,去除其中的噪音,并使用BPE方法进行分词;(2)从CodeBert的每一层中提取表征信息作为表征信息序列,使用双向循环神经网络(Bi‑LSTM)和注意力机制关注可提供重要表征信息的层;(3)基于语料库对构建的模型进行训练,得到代码编程语言分类模型。本发明的有益效果为:该方法能快速识别源代码所属的编程语言类型,降低手工分类源代码编程语言的成本。
-
公开(公告)号:CN116882686A
公开(公告)日:2023-10-13
申请号:CN202310871363.1
申请日:2023-07-14
Applicant: 南通大学
IPC: G06Q10/0631 , G06N3/126
Abstract: 本发明公开一种基于改进遗传算法解决多偏好的超市智能排班算法,包含以下步骤:设置店铺预设条件;基于预设条件构建和改进算法模型;根据改进遗传算法求解排版模型。本发明的基于改进遗传算法解决多偏好的超市智能排班算法,提出一种基于改进的遗传算法,加入依据种群适应度标准差的高斯扰动和增大变异概率进行求解。与传统的的以列表为主的编码方式相比,本发明提出以矩阵为主的编码方式,不同的位置代表不同的班次,可以更直观的表示排班表和种群个体基因的转换,同时可以更好的变异,以加快收敛速度,找到更改的解。
-
公开(公告)号:CN115794218A
公开(公告)日:2023-03-14
申请号:CN202211585727.1
申请日:2022-12-09
Applicant: 南通大学
IPC: G06F8/73 , G06F40/166 , G06N3/0442
Abstract: 本发明提供了一种基于语义信息增强的Bash代码注释生成方法,属于计算机领域。解决了Bash注释生成任务中数据集较小和不能全部利用CodeBERT输出的所有特征信息的问题。其技术方案为:包括以下步骤:S1:在语料库生成的嵌入层使用对抗训练,生成对抗样本以增强语义信息;S2:使用原语料库生成的词嵌入和对抗样本对CodeBERT进行微调,输出12层表征信息;S3:使用Bi‑LSTM+注意力机制聚合12层表征信息,生成融合信息;S4:使用解码器进行解码并输出Bash注释。本发明的有益效果为:本发明提出的模型可以捕获和利用更多的语义表征信息,从而提高注释生成的质量和可靠性。
-
公开(公告)号:CN115130480A
公开(公告)日:2022-09-30
申请号:CN202210405606.8
申请日:2022-04-18
Applicant: 南通大学
IPC: G06F40/58 , G06F40/30 , G06F40/289 , G06F40/211
Abstract: 本发明属于机器翻译质量检测技术领域,公开了一种基于辅助翻译软件和双粒度替换的英中翻译软件测试方法。针对需要测试的一系列英文源句,首先借助辅助翻译软件,通过计算主英中机器翻译软件和辅助英中机器翻译软件的翻译结果间的余弦相似度,识别出错误候选句子。随后对英文源句进行双粒度替换,以生成替换后的英文源句。并基于成分句法分析和依存句法分析,通过对比原始英文源句和替换后的英文源句在主英中机器翻译软件的翻译结果的结构表征来进一步识别出错误候选句子。最后通过分析被归为错误候选句子的英文源句,尝试定位并修复英中翻译软件测试方法的实现代码,以提高英中翻译软件的翻译质量。
-
公开(公告)号:CN114880206A
公开(公告)日:2022-08-09
申请号:CN202210038845.4
申请日:2022-01-13
Applicant: 南通大学
Abstract: 本发明提供了一种移动应用程序代码提交故障预测模型的可解释性方法,包括以下步骤:(1)通过挖掘版本控制系统,搜集来自移动应用程序项目内的代码提交,随后对代码提交进行度量和标注,形成数据集;(2)根据数据集,借助随机森林构建出移动应用程序代码提交故障预测模型;(3)当面对新的代码提交时,对该代码提交进行度量,然后输入到代码提交故障预测模型中,得到预测结果;(4)对局部可解释性技术LIME进行超参优化,使用超参优化的LIME方法ExplainApp生成该预测结果的解释。本发明的有益效果为:预测出新的代码提交是否会引入故障,同时可以给出相应的高质量解释,辅助开发人员完成后续故障的理解、定位和修复。
-
-
-
-
-
-
-
-
-