一种基于描述关键词抽取的缺陷报告严重程度预测方法

    公开(公告)号:CN113011180B

    公开(公告)日:2024-09-03

    申请号:CN202110412776.4

    申请日:2021-04-16

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于描述关键词抽取的缺陷报告严重程度预测方法,选择相应软件项目在缺陷跟踪系统中的缺陷摘要、缺陷描述与严重程度;对缺陷摘要进行分词、去停用词、词形还原处理;对缺陷描述进行字符串替换、关键词抽取、分词、去停用词、词形还原处理;基于严重程度对缺陷摘要与缺陷描述分别进行词向量模型的训练与构建,从而获取相对应的向量;基于向量采用逻辑回归分类方法获取缺陷报告严重程度预测模型;采用该模型预测软件项目中缺陷报告的严重程度。本发明的有益效果为:本发明采用从缺陷描述中提取的关键词对缺陷摘要进行补充,能实现更好的模型预测性能。

    基于对偶学习的shellcode代码和注释生成方法

    公开(公告)号:CN114546397B

    公开(公告)日:2024-08-20

    申请号:CN202210041705.2

    申请日:2022-01-14

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于对偶学习的shellcode代码和注释生成方法,包括以下步骤:(1)搜集来自shellstorm和Exploit Database的shellcode语料库;(2)将shellcode注释生成和shellcode代码生成这两个任务形式化为一个对偶学习问题,并通过为输入添加前缀来区分两个任务,使用浅层的Transformer进行同步学习,实现知识共享,提高训练模型的性能和泛化能力;(3)提出了一种改进自注意力计算的归一化方法Adjust_QKNorm,以使Transformer适应低资源任务;(4)提出一个基于规则的修复组件。本发明的有益效果为:有利于软件的开发和维护,生成的高质量注释和代码可以帮助提高开发人员的工作效率,进而提高软件质量。

    一种多机型多物资类型无人机应急配送路径规划方法及其规划系统

    公开(公告)号:CN114169828B

    公开(公告)日:2024-06-04

    申请号:CN202111492240.4

    申请日:2021-12-08

    Applicant: 南通大学

    Inventor: 吴蕾 陈翔 魏明

    Abstract: 本发明涉及无人机配送技术领域,具体涉及一种多机型多物资类型无人机应急配送路径规划方法及其规划系统,包括:建立配送中心,由配送中心按照物资类型选择无人机类型;采用蚁群算法为每个无人机规划可行路径;应知物流配送需保证到达客户处有足够的物资可以提供;设置无人机从配送中心出发后的第一个访问点一定为供应商,即从供应商集中取出一点作为无人机访问的下一访问点;本发明在对无人机配送路径规划中,综合考虑了客户需求物资类型的多样性以及无人机自身性能的约束,采用蚁群算法的方式,可以保证无人机到达客户点时拥有足够的物资。同时,可以在选出能耗成本最优的飞行路径,从而提高无人机的运输效率以及提高配送的经济性。

    一种基于上下文学习和大语言模型的Solidity注释生成方法

    公开(公告)号:CN117492825A

    公开(公告)日:2024-02-02

    申请号:CN202311408261.2

    申请日:2023-10-27

    Applicant: 南通大学

    Abstract: 本发明提供了基于上下文学习和大语言模型的Solidity代码注释生成方法,属于软件工程技术领域。解决了主流方法不能生成新注释,依赖数据集和泛化能力不足的技术问题。其技术方案为:包括以下步骤:(1)通过智能合约代码社区搜集语料库;(2)检索出最相似的前n个代码片段。(3)为支持大语言模型的上下文学习,结合检索到的示范与定制的提示词构造提示模板。(4)调用大语言模型API,结合提示模板完成注释生成。本发明的有益效果:本发明无需额外训练,可显著提高自动生成的代码注释质量。

    一种基于Transformer的代码编程语言分类方法

    公开(公告)号:CN113139054B

    公开(公告)日:2023-11-24

    申请号:CN202110430772.9

    申请日:2021-04-21

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于Transformer的代码编程语言分类方法,包括以下步骤:(1)从Stack Overflow上搜集问答帖子作为数据集,对原始数据集中的数据进行数据预处理;(2)对使用BPE分词后的数据进行词嵌入将词转换成向量;(3)基于上述构建的数据集,对RoBERTa模型进行微调,将生成的词向量输入进RoBERTa模型,通过双层的Transformer编码器进行代码语义的学习,生成语义表示向量Xsemantic;(4)将语义向量Xsemantic通过线性层映射到编程语言类别标签上,通过Softmax算法得到相应的编程语言。本发明的有益效果为:可以根据代码片段快速识别代码类型,以起到辅助开发人员在问答网站上快速寻找到解决方案的作用。

    基于预训练模型T5的编程问答帖子标题自动补全方法

    公开(公告)号:CN116738976A

    公开(公告)日:2023-09-12

    申请号:CN202310050161.0

    申请日:2023-02-01

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于预训练模型T5的编程问答帖子标题自动补全方法,属于计算机技术领域,解决了开发人员不能很好的总结提炼问题帖标题,导致标题质量低而不能及时得到有效回复的问题。其技术方案为:包括以下步骤:(1)搜集高质量问题贴;(2)语料库的构建及预处理;(3)标题补全模型的构建;(4)标题补全模型的应用。本发明的有益效果为:减少开发人员编写标题时所需的时间和精力,帮助他们编写更高质量的标题。

    一种基于数据增强和语义感知的Bash代码注释自动生成方法

    公开(公告)号:CN116257253A

    公开(公告)日:2023-06-13

    申请号:CN202310167403.4

    申请日:2023-02-27

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于数据增强和语义感知的Bash代码注释自动生成方法,属于计算机领域。解决了Bash注释生成任务中低资源和不能有效利用BERT模型输出的所有特征信息的问题。其技术方案为:包括以下步骤:S1:在模型嵌入层使用NP‑GD,生成多组对抗例子;S2:利用原训练集和生成的对抗例子微调CodeBERT;S3:使用LSTM+Attention聚合步骤S2输出的多层表征信息;S4:使用Transformer解码器解码步骤S3输出的融合向量并输出Bash注释。本发明的有益效果为:该方法可以捕获更多的表征信息,提高Bash注释生成的质量。

    基于GraphSAGE和LDA的软件缺陷预测方法

    公开(公告)号:CN116166563A

    公开(公告)日:2023-05-26

    申请号:CN202310211242.4

    申请日:2023-03-07

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于GraphSAGE和LDA的缺陷预测方法,属于计算机技术领域,解决了手工特征方法没有考虑代码项目的自然语言信息软件缺陷预测的问题。其技术方案为:包括以下步骤:(1)搜集来自Github的缺陷实例数据集,对该数据集进行预处理操作;(2)使用LDA提取项目的主题描述信息;(3)将代码片段解析为抽象语法树,并且提取token之间的关系矩阵;(4)通过BERT对token和主题词信息编码为特征向量,并对向量进行拼接;(5)将向量输入GraphSAGE训练,得到每个节点的特征表示;(6)将节点表示输入到mlp分类器中,进行缺陷预测。本发明的有益效果为:提高缺陷预测的可靠性和准确性。

    一种基于预训练模型和空间结构信息的代码注释生成方法

    公开(公告)号:CN115469925A

    公开(公告)日:2022-12-13

    申请号:CN202211198773.6

    申请日:2022-09-29

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于预训练模型和空间结构信息的代码注释生成方法,属于计算机领域。解决了注释生成模型中代码特征提取部分缺乏代码空间结构的问题。其技术方案为:包括以下步骤:S1:抽取Java部分并进行预处理;S2:使用CodeBERT提取代码语义特征,并进行关键特征提取和降维;S3:构建数据集的抽象语法树(ASTs);S4:构建GNN神经网络;S5:将步骤S2中提取的语义特征向量和步骤S3得到的ASTs信息输入GNN模型;S6:将步骤S2得到的语义特征信息和步骤S5得到的结构特征信息结合;S7:使用解码器进行解码并输出注释。本发明的有益效果为:本发明提高注释生成的质量和可靠性。

Patent Agency Ranking