-
公开(公告)号:CN114816517B
公开(公告)日:2024-07-16
申请号:CN202210488430.7
申请日:2022-05-06
Applicant: 哈尔滨工业大学
IPC: G06F8/74 , G06N3/0442 , G06N3/08 , G06N3/042 , G06N3/045
Abstract: 本发明公开了一种层次语义感知的代码表示学习方法,所述方法针对给定的源代码,首先利用程序分析技术构建程序的有向无环语义图,然后抽取语义图中的语法子树信息,并利用Tree‑LSTM模型学习程序中每条语句的局部语义向量表示,最后基于语句的局部语义向量表示,利用Graph‑LSTM模型学习代码的结构和顺序语义信息。本发明首次提出适用于程序结构语义编码的基于图的LSTM模型Graph‑LSTM,并提出一种能够将源代码序列信息融入到代码表示学习过程中的新框架,提高了模型的特征表示能力。
-
公开(公告)号:CN117608525A
公开(公告)日:2024-02-27
申请号:CN202311583577.5
申请日:2023-11-24
Applicant: 哈尔滨工业大学
Abstract: 一种基于大模型的SysML状态机图形式化需求验证方法,属于计算机软件开发技术领域。方法如下:收集SysML状态机图数据集,追溯对应需求文本,而后对SysML状态机图以及需求文本进行翻译并进行验证;对SysML状态机图以及需求文本进行处理;为大模型设置提示模板,对两组大规模数据集进行批量训练;获取SysML状态机图和需求文本的翻译结果并以NuSMV可识别的语言的形式进行表示;对所得代码进行相应修改;将得到的目标代码输入NuSMV进行形式化验证。本发明提高了验证的效率,使验证方法更具普适性,减轻了在不同领域中应用形式验证方法时的繁琐工作,能够适应多种需求验证场景。
-
公开(公告)号:CN115859307A
公开(公告)日:2023-03-28
申请号:CN202211678532.1
申请日:2022-12-26
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于树型注意力和加权图匹配的相似漏洞检测方法,首先,分别为目标函数、漏洞函数和补丁函数生成FCG、vSCG、pSCG。其次,利用语句节点嵌入网络分别提取FCG、vSCG和pSCG语句节点的语义和语法信息。接着,利用图神经网络和加权图匹配方法构成的图匹配模型,学习并计算FCG和vSCG之间以及FCG和pSCG之间的相似度,然后利用计算的三元组损失函数调整网络参数,训练检测模型。最后,利用训练好的模型检测软件中的相似漏洞。本发明可以在捕获代码中与漏洞相关的语法和语义特征的同时,有效利用补丁信息区分仅有细微差异的漏洞和补丁函数,从而提高相似漏洞检测的准确率。
-
公开(公告)号:CN115730310A
公开(公告)日:2023-03-03
申请号:CN202211468462.7
申请日:2022-11-22
Applicant: 哈尔滨工业大学
IPC: G06F21/56 , G06F18/214 , G06F18/24
Abstract: 本发明公开了一种基于多特征融合深度学习的安卓恶意软件检测与分类方法,所述方法是通过获取待测Apk样本、将待测Apk样本送入训练好的模型并得到检测结果完成的。本发明通过深度学习从静态污点路径中捕获不同类型恶意软件的数据流模式,将污点路径作为一组特征,进行安卓恶意软件的检测与分类,并使用Wide&Deep模型进行特征融合,其中Wide部分处理敏感API调用和危险权限两类特征,Deep部分处理静态污点路径,融合后的特征,增加了静态污点路径带有的语义信息,可以学习到不同恶意软件的行为模式,提升了模型的准确率和鲁棒性。
-
公开(公告)号:CN115577362A
公开(公告)日:2023-01-06
申请号:CN202211105496.X
申请日:2022-09-09
Applicant: 哈尔滨工业大学
IPC: G06F21/57 , G06F18/25 , G06F18/213
Abstract: 本发明公开了一种基于源代码和汇编代码跨模态特征增强的漏洞检测方法,所述方法从源代码中提取控制依赖和数据依赖相关的语法语义特征,从汇编代码中提取内存操作相关的语法语义特征,然后使用高级语言程序源代码与其语句对齐的汇编代码输入到跨模态特征增强和融合的双模态表示学习模型进行软件漏洞检测。该方法能够对高级语言源代码和汇编代码两种程序模态进行表示学习,利用源代码和汇编代码之间的语句对齐关系,分别在源代码模态和汇编代码模态提取漏洞相关的语义特征,并使用不同的深度学习网络和交叉注意力机制学习二者之间的语义关联性,充分利用两种模态程序的特征互补性进行特征级融合,从而提升软件漏洞检测的准确性。
-
公开(公告)号:CN114816431A
公开(公告)日:2022-07-29
申请号:CN202210569302.5
申请日:2022-05-24
Applicant: 哈尔滨工业大学
IPC: G06F8/41
Abstract: 本发明公开了一种SysML语言的安全可靠语义扩展和建模方法,所述方法通过扩展需求图的安全和可靠语义、增加冗余语义、失效模式和影响分析语义、故障树语义,并构建可视化模型,使得SysML语言既支持自动从系统模型中提取安全可靠分析的相关信息,也支持利用安全可靠分析进一步完善系统模型,从而将基于模型的系统工程和安全可靠分析过程有效地融合,有助于确保安全分析和系统设计之间的一致性,解决当前设计复杂安全关键系统的问题。
-
公开(公告)号:CN114416570A
公开(公告)日:2022-04-29
申请号:CN202210068537.6
申请日:2022-01-20
Applicant: 哈尔滨工业大学
IPC: G06F11/36
Abstract: 本发明公开了一种基于加权软件行为图的等价变异体检测方法,首先解析原始程序和变异体的源代码,进行语句级插桩,为后续执行时捕获执行路径奠定基础。其次,分别运行原始程序和变异体,在相同的输入下,如果变异体的输出与原始程序的输出不一致,这类变异体一定是不等价的,直接排除,否则可能是等价的,继续后续处理。最后,逐一对比相同输入下变异体和原始程序的加权软件行为图,如果在任一输入下二者不相等,则该变异体与原始程序不等价,如果在全部输入下二者始终相等,则该变异体等价于原始程序。该方法既能够像人工判定时一样准确追踪程序的内部执行行为,提高等价变异体判断的准确性,又能够减少人工判定成本,提高等价变异体检测的效率。
-
公开(公告)号:CN113849162A
公开(公告)日:2021-12-28
申请号:CN202111142407.4
申请日:2021-09-28
Applicant: 哈尔滨工业大学
Abstract: 一种利用模型驱动和深度神经网络相结合的代码生成方法,涉及一种代码生成方法。所述方法包括如下步骤:使用活动图对目标需求建模后,自动生成逻辑结构代码;利用训练好的深度神经网络模型完成自然语言需求描述到具体功能代码的生成。本发明依靠两种代码生成各自的优点,弥补对方的不足,即利用模型驱动解决基于自然语言的代码生成中的长距离依赖和代码粒度较小的问题;又基于自然语言的生成解决模型驱动代码生成中代码细节信息不丰富的问题,对功能复杂的代码既可以保证逻辑的正确性以及长结构的正确性,又可以一定程度保证代码细节的正确性。
-
公开(公告)号:CN112699377A
公开(公告)日:2021-04-23
申请号:CN202011613496.1
申请日:2020-12-30
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于切片属性图表示学习的函数级代码漏洞检测方法,首先引入新的切片准则,并提出切片属性图的概念,基于切片准则和程序切片技术生成代码的切片属性图,提取与漏洞候选关键点有依赖关系的图结构信息、节点属性信息和代码上下文信息;然后,利用关系图卷积神经网络并结合基于节点和子图的双重注意力机制,对切片属性图进行表示学习,以学习更全面、更准确的漏洞模式;最后对各个切片属性图的漏洞识别结果进行融合实现函数级别的漏洞检测,并确定漏洞候选语句的集合以及与漏洞相关联的语法要素。该方法能覆盖更多的漏洞候选关键点,充分学习和表示漏洞相关的结构、属性和上下文信息,提高漏洞检测的准确率。
-
公开(公告)号:CN109144882A
公开(公告)日:2019-01-04
申请号:CN201811096080.X
申请日:2018-09-19
Applicant: 哈尔滨工业大学
IPC: G06F11/36
CPC classification number: G06F11/3684
Abstract: 本发明公开了一种程序不变量的软件故障定位方法及装置。该方法包括:针对目标软件源代码进行语句、值和逻辑表达式级的插桩,采用预设的测试用例集合执行插桩后的源代码,获得执行信息;对预设失败测试用例集合进行聚类,并对每个聚类,选择有助于区分缺陷语句的成功测试用例集合;学习优选成功测试用例集合的执行信息,获得程序不变量集合,包括集合型、真值表型和浮点型范围不变量;根据失败测试用例集合的执行信息和程序不变量集合检测不变量违背,获得可疑语句集合。采用依赖分析过滤掉因故障传播导致的不变量违背误检,统计分析各语句处的不变量违背,计算语句可疑度。本发明提高了软件故障定位的准确性,克服了逻辑表达式缺陷定位漏检问题。
-
-
-
-
-
-
-
-
-