-
公开(公告)号:CN117494131A
公开(公告)日:2024-02-02
申请号:CN202311408265.0
申请日:2023-10-27
Applicant: 南通大学
IPC: G06F21/57 , G06F16/33 , G06F40/289 , G06F40/30
Abstract: 本发明提供了一种改进的基于大语言模型的漏洞检测方法,属于计算机技术领域,解决了传统漏洞检测方法的准确率和效率低下的技术问题。其技术方案为:包括以下步骤:S1:构成漏洞数据集;S2:将数据集划分成训练集、验证集和测试集;S3:使用CodeT5模型提取语义特征;S4:通过计算语义相似度得到数据集中与目标代码最相似的TOP k个候选代码;S5:融合候选代码和目标代码的词法相似性和语法相似性得到一个混合分数;S7:加入身份信息提示和领域信息提示;S8:将提示、目标代码、图结构数据和最相似的示范提供给大语言模型。本发明的有益效果为:能够更准确地识别潜在的漏洞,并提高模型的鲁棒性和适应性。
-
公开(公告)号:CN116910760A
公开(公告)日:2023-10-20
申请号:CN202310615838.0
申请日:2023-05-29
Applicant: 南通大学
Abstract: 本发明提供了一种使用CodeT5模型和提示微调的源代码漏洞检测方法,属于计算机技术领域,解决了传统的漏洞检测模型中检测准确率不高的技术问题。包括以下步骤:S1:从中收集开源项目的C和C++源代码,构成数据集;S2:对数据集进行预处理;S3:对构建的数据集随机划分成训练集、验证集和测试集;S4:使用hard soft方式创建为漏洞检测任务定制的提示模板;S5:创建为漏洞检测任务定制的Verbalizer;S6:训练集训练分类器;S7:对测试集进行最终结果预测。本发明的有益效果为:使用基于提示微调的预训练模型CodeT5进行漏洞检测,从而提高漏洞检测的性能。
-
公开(公告)号:CN111400652B
公开(公告)日:2023-06-13
申请号:CN202010134409.8
申请日:2020-03-02
Applicant: 南通大学
Abstract: 本发明提供了一种非负矩阵社区发现方法及电影社区发现方法,包括如下步骤S11数据收集与计算,形成相似度矩阵X和L;S12将X进行非负矩阵分解,X≈UV;S13构造含有L的目标函数O;以及S14基于目标函数,得到非负矩阵分解的迭代公式,进行迭代,完成社区划分。本发明的一种非负矩阵社区发现方法及电影社区发现方法,将双属性的非负矩阵分解应用于社区发现,提高了社区分解模块的精确性。
-
公开(公告)号:CN115185731A
公开(公告)日:2022-10-14
申请号:CN202210849549.2
申请日:2022-07-19
Applicant: 南通大学
Abstract: 本发明提供了一种混合多个深度学习模型以促进阻塞Bug预测的方法,属于计算机应用技术领域,解决了自动化预测多对Bug之间存在阻塞关系的技术问题。其技术方案为:包括以下步骤:(1)从Bug报告中提取“Summary”和“Description”两个字段构成数据集;(2)将自然语言文本进行词干恢复;(3)将这两个字段进行编码转换为词向量形式;(4)构建预测模型;(5)将两个分类器给出的值的加权和相加,得到最终的预测模型。本发明的有益效果为:本发明构建两个深度学习模型,并通过集成学习的方法Boosting将其结合起来,从而得到一个更全面、更稳健的预测模型,实现对阻塞Bug更好的预测。
-
公开(公告)号:CN113744072A
公开(公告)日:2021-12-03
申请号:CN202110987729.2
申请日:2021-08-26
Applicant: 南通大学
Abstract: 本发明公开了一种基于深度神经网络融合拓扑和内容社团检测方法,属于复杂网络分析技术领域,该方法挖掘带有内容信息的网络数据集中社团结构,运用模块度最大化和标准化切割分别建模拓扑和内容,基于谱矩阵特征值分解、矩阵低秩拟合和自动编码器重构在理论上的相似,无缝融合拓扑和内容,以构建基于自动编码器框架深度神经网络的社团检测模型;最后使用评价算法归一化互信息熵、杰卡德系数评估模型有效性。本发明的有益效果为:利用自动编码器框架无缝融合拓扑和内容,另一方面基于深度神经网络获取的网络表征具有良好的社团检测能力。
-
-
-
-