-
公开(公告)号:CN117111946A
公开(公告)日:2023-11-24
申请号:CN202310621627.8
申请日:2023-05-30
Applicant: 中南大学
IPC: G06F8/41 , G06F16/33 , G06F8/71 , G06F18/22 , G06F18/213 , G06N3/045 , G06N3/0464 , G06N3/09 , G06N3/0895
Abstract: 本发明公开了一种跨语言代码搜索方法、终端设备及存储介质,使用预训练的CodeBERT获取代码tokens的表示,提取代码的序列特征矩阵 按行展平,作为代码片段的结构特征vtok;采用图卷积运算提取统一后的AST的特征,将图卷积运算最后一层的特征矩阵 按行展平,作为代码片段的结构特征vast;融合代码片段的结构特征vtok和作为代码片段的结构特征vast,得到完整的代码特征vcode;利用所述完整的代码特征vcode进行对比学习,得到跨语言代码搜索模型。本发明提高了模型对不同编程语言但是功能相同的代码片段的区分能力。