-
公开(公告)号:CN117591647A
公开(公告)日:2024-02-23
申请号:CN202311555457.4
申请日:2023-11-21
Applicant: 重庆大学
IPC: G06F16/332 , G06F16/31 , G06F16/33 , G06N3/0464 , G06N3/08 , G06N5/04
Abstract: 本发明涉及一种预训练代码增强的编程问答社区答案推荐方法,分为两个阶段,训练阶段和推荐阶段。训练阶段可分为标签推荐预训练阶段和问答分类微调阶段,其中标签推荐预训练模型使用问题中的标题、主体、代码信息作为输入,以问题标签作为真值进行学习;在微调阶段,复用预训练模型,分别对问题和答案中的信息进行编码,最后将问题和答案的特征向量映射到分类空间中。推荐阶段对于一个新问题,先使用搜索引擎查询相似的问题标题,取前Q个作为候选问题,并确定候选答案,将候选答案与新问题作为微调过的模型的输入,得到每对问答的分类的置信概率,通过加权求和的方式计算问答的匹配得分,排序之后前Q’为最终的推荐答案。
-
公开(公告)号:CN117556037A
公开(公告)日:2024-02-13
申请号:CN202311572311.0
申请日:2023-11-23
Applicant: 重庆大学
IPC: G06F16/34 , G06F18/214 , G06F18/213 , G06F18/25 , G06N3/0455 , G06N3/0464 , G06N3/042 , G06N3/08 , G06F8/30 , G06F8/36 , G06F8/41 , G06F8/73 , G06N3/0442
Abstract: 本发明涉及一种基于单词替换策略的用于代码汇总的多模态摘要生成方法,包括三个基本阶段:特征表示、特征学习和复合解码器。在初始阶段,将方法名、令牌、AST、CFG和DFG等代码特征与其各自的位置信息合并,然后嵌入以派生代码表示向量。在第二阶段,将方法名和标记向量输入到交叉注意机制中。同时,从结构组合图SCG中得到的结构侧特征向量通过图‑注意机制进行处理。通过特征学习可以得到两个精炼的特征向量。最后,将两个增强的特征向量与代码摘要相结合,提供给复合解码器进行训练,得到所需的最终代码摘要。
-