一种基于深层语义和数据增强的软件漏洞检测方法

    公开(公告)号:CN116467718A

    公开(公告)日:2023-07-21

    申请号:CN202310390442.0

    申请日:2023-04-13

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于深层语义和数据增强的软件漏洞检测方法,属于计算机技术领域。解决了软件质量得不到保障的技术问题。其技术方案为:包括以下步骤:(1)搜集来自NIST的Java漏洞代码函数,对该漏洞代码集合进行预处理操作;(2)通过构建AST提取代码的结构化特征;(3)使用CodeBERT提取代码语义特征,并通过BERT‑Whitening进行关键特征提取和降维;(4)构建DR‑GD模型生成对抗样本,拓展原有的训练数据;(5)构建残差网络改进的图神经网络模型,学习代码的深层义以表示,用于软件漏洞检测。本发明的有益效果为:可以生成多样的对抗实例,提高软件漏洞检测的准确性和可靠性。

    一种基于增强嵌入向量语义表示的软件缺陷定位方法

    公开(公告)号:CN116302953A

    公开(公告)日:2023-06-23

    申请号:CN202310034262.9

    申请日:2023-01-10

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于增强嵌入向量语义表示的软件缺陷定位方法,属于计算机技术领域,解决了多模态嵌入向量语义信息表示不足的技术问题。其技术方案为:包括以下步骤:S1:对源代码进行数据增强;S2:构造模态之间和模态内部的正负样本对;S3:对缺陷报告进行文本预处理,得到文本序列;S4:文本序列输入CodeBert预训练模型得到嵌入向量表示;S5:学习模态内部和模态之间的相似性;S6:联合检索任务和二元分类任务微调预训练模型。S7:对源代码文件进行排序得到预测结果。本发明的有益效果为:通过对比学习,获得更好的嵌入向量表示,联合检索模型和分类模型对源代码文件进行排序,进一步提高缺陷定位的有效性。

    一种基于CNN模型和领域特征的软件缺陷定位方法

    公开(公告)号:CN115617689A

    公开(公告)日:2023-01-17

    申请号:CN202211357801.4

    申请日:2022-11-01

    Applicant: 南通大学

    Abstract: 本发明提出了一种基于CNN模型和领域特征的软件缺陷定位方法,属于计算机技术领域。解决了缺陷定位方法不能充分使用代码结构和语义特征的问题。其技术方案为:包括以下步骤:S1、对数据集进行预处理;S2、通过Word2Vec生成词向量;S3、使用CNN网络分别提取词汇特征和代码结构特征,并通过MLP网络进行特征融合;S4、利用rVSM提取文本相似性;S5、从bug修复历史中提取4种类型的特征;S6、构造数据集,按比例划分训练集和测试集;S7、将步骤S2、步骤S3、步骤S4提取出的6种特征输入MLP网络;S8:通过softmax函数得到二分类结果。本发明的有益效果为:本发明采用学习统一的词汇语义和代码结构特征,同时融合文本相似性特征和缺陷修复历史从而提高缺陷定位的质量和可靠性。

    一种中文语音增强识别及文本纠错矫正方法

    公开(公告)号:CN115602161A

    公开(公告)日:2023-01-13

    申请号:CN202211295191.X

    申请日:2022-10-21

    Abstract: 本发明属于语音及文本处理领域,具体涉及一种中文语音增强识别及文本纠错矫正方法,包括:对待识别音频进行预处理,通过声纹模型进行特征提取并建立初始粗糙方言鉴别模型;建立初始网络模型对初始粗糙方言鉴别模型进行训练得到方言鉴别模型;基于N‑gram语言模型确定纠错候选分词集合;通过Bigram2元语言模型和N‑gram语言模型进行纠错矫正后输出文本。本发明对待识别音频进行预处理,减少语音识别干扰因素,采用GMM‑SVM模型提高了识别性能,采用GMM‑UBM模型和LSTM模型的组合模型建立初始网络模型拥有更快更好的训练拟合效果,通过N‑gram语言模型和Bigram2元语言模型进行文本处理纠错有效降低了错误率,优化了待识别音频转换成文本信息的结果。

    一种基于改进的拓扑排序的培养方案教学计划编制方法

    公开(公告)号:CN115271510A

    公开(公告)日:2022-11-01

    申请号:CN202210955763.6

    申请日:2022-08-10

    Applicant: 南通大学

    Abstract: 本发明涉及智能计算技术领域,尤其涉及一种基于改进的拓扑排序的培养方案教学计划编制方法,具体步骤如下:S1:根据培养方案中的课程信息,得到反映课程之间关系的有向图G;S2:在拓扑排序中增设阶数对有向图G进行拓扑排序,得到拓扑序列S1;S3:对拓扑序列S1按阶数进行排序,得到序列S2;S4:量化课程设置条件;S5:按课程设置条件,将序列S2分割成若干个子序列,将课程落实到每学期中。本发明能够使教学计划制定自动化,一方面提高教学计划编制的工作效率,另一方面提高教学计划的科学性和合理性,并且可以方便教学评估、专业认证中教学计划方面的数据分析。本发明可以用于高校人才培养方案的教学计划编制,所以实用性强,使用面广。

    一种基于预训练模型和空间结构信息的代码注释生成方法

    公开(公告)号:CN115469925A

    公开(公告)日:2022-12-13

    申请号:CN202211198773.6

    申请日:2022-09-29

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于预训练模型和空间结构信息的代码注释生成方法,属于计算机领域。解决了注释生成模型中代码特征提取部分缺乏代码空间结构的问题。其技术方案为:包括以下步骤:S1:抽取Java部分并进行预处理;S2:使用CodeBERT提取代码语义特征,并进行关键特征提取和降维;S3:构建数据集的抽象语法树(ASTs);S4:构建GNN神经网络;S5:将步骤S2中提取的语义特征向量和步骤S3得到的ASTs信息输入GNN模型;S6:将步骤S2得到的语义特征信息和步骤S5得到的结构特征信息结合;S7:使用解码器进行解码并输出注释。本发明的有益效果为:本发明提高注释生成的质量和可靠性。

    一种基于深度残差收缩网络的眼病诊断方法

    公开(公告)号:CN115456981A

    公开(公告)日:2022-12-09

    申请号:CN202211073636.X

    申请日:2022-09-02

    Applicant: 南通大学

    Abstract: 本发明涉及人工智能神经网络技术领域,尤其涉及一种基于深度残差收缩网络的眼病诊断方法,包括:S1:采集病人结构化、脱敏眼科图像集据作为样本数据,并对眼部数据根据病情进行类别标注;S2:对采集的眼部图像进行预处理;S3:构建训练集和测试集,采用分层抽样算法对训练集中眼部样本数据进行采样,均衡样本数据;S4:将训练集输入深度残差收缩网络,对深层特征进行多尺度提取,去除噪声,输出分类结果;S5:训练并优化模型,测试集测试模型性能,实现眼部疾病诊断。本发明采用注意力机制,抽取出更加关键及重要的信息,使模型做出更加准确的判断;使用软阈值化,减少噪声影响;采用分层抽样和交叉熵损失函数优化算法,提高训练和预测的准确度。

Patent Agency Ranking