一种预训练代码增强的编程问答社区答案推荐方法

    公开(公告)号:CN117591647A

    公开(公告)日:2024-02-23

    申请号:CN202311555457.4

    申请日:2023-11-21

    Applicant: 重庆大学

    Abstract: 本发明涉及一种预训练代码增强的编程问答社区答案推荐方法,分为两个阶段,训练阶段和推荐阶段。训练阶段可分为标签推荐预训练阶段和问答分类微调阶段,其中标签推荐预训练模型使用问题中的标题、主体、代码信息作为输入,以问题标签作为真值进行学习;在微调阶段,复用预训练模型,分别对问题和答案中的信息进行编码,最后将问题和答案的特征向量映射到分类空间中。推荐阶段对于一个新问题,先使用搜索引擎查询相似的问题标题,取前Q个作为候选问题,并确定候选答案,将候选答案与新问题作为微调过的模型的输入,得到每对问答的分类的置信概率,通过加权求和的方式计算问答的匹配得分,排序之后前Q’为最终的推荐答案。

Patent Agency Ranking