一种预训练代码增强的编程问答社区答案推荐方法

    公开(公告)号:CN117591647A

    公开(公告)日:2024-02-23

    申请号:CN202311555457.4

    申请日:2023-11-21

    Applicant: 重庆大学

    Abstract: 本发明涉及一种预训练代码增强的编程问答社区答案推荐方法,分为两个阶段,训练阶段和推荐阶段。训练阶段可分为标签推荐预训练阶段和问答分类微调阶段,其中标签推荐预训练模型使用问题中的标题、主体、代码信息作为输入,以问题标签作为真值进行学习;在微调阶段,复用预训练模型,分别对问题和答案中的信息进行编码,最后将问题和答案的特征向量映射到分类空间中。推荐阶段对于一个新问题,先使用搜索引擎查询相似的问题标题,取前Q个作为候选问题,并确定候选答案,将候选答案与新问题作为微调过的模型的输入,得到每对问答的分类的置信概率,通过加权求和的方式计算问答的匹配得分,排序之后前Q’为最终的推荐答案。

    一种基于两阶段注意力机制的代码搜索方法

    公开(公告)号:CN112800172A

    公开(公告)日:2021-05-14

    申请号:CN202110167463.7

    申请日:2021-02-07

    Applicant: 重庆大学

    Abstract: 本发明公开了一种基于两阶段注意力机制的代码搜索方法,具体包括如下步骤:选取一代码片段,从代码片段中所包含的函数名和函数体中提取文本特征及结构特征;根据所提取的文本特征和结构特征构建这两种特征的特征矩阵;融合文本特征矩阵和结构特征矩阵得到本代码片段的代码特征矩阵;从查询的语句中提取相关特征构建查询特征矩阵;利用代码特征矩阵和查询特征矩阵建立代码与查询的相关矩阵;通过计算相关矩阵得到所需的向量参数,最后根据向量参数与特征矩阵得出与查询语句最匹配的代码片段。

    一种恶性肿瘤合并静脉血栓栓塞症风险预测方法

    公开(公告)号:CN113674864B

    公开(公告)日:2023-08-11

    申请号:CN202111007447.8

    申请日:2021-08-30

    Applicant: 重庆大学

    Abstract: 本发明公开了一种恶性肿瘤合并静脉血栓栓塞症风险预测方法,该方法首先对采集的病人信息进行预处理得到基础数据集,再进行双向联合重采样得到训练集,然后对训练集中每个训练样本进行特征筛选,去掉冗余特征;构建和训练StackingXgbMlp模型,该模型包括两层,第一层包括并联的一个XGBoost模型和一个MLP模型,第二层包括一个XGBoost模型;训练完成后将未知是否患病的病人信息采用S100的方法进行预处理,再采用S300的方法进行特征筛选得到待预测样本,将该待预测样本输入训练好的StackingXgbMlp模型中,输出待预测样本患病的预测概率。实验表明,本发明方法在预测准确性比传统方法好。

    一种基于两阶段注意力机制的代码搜索方法

    公开(公告)号:CN112800172B

    公开(公告)日:2022-07-12

    申请号:CN202110167463.7

    申请日:2021-02-07

    Applicant: 重庆大学

    Abstract: 本发明公开了一种基于两阶段注意力机制的代码搜索方法,具体包括如下步骤:选取一代码片段,从代码片段中所包含的函数名和函数体中提取文本特征及结构特征;根据所提取的文本特征和结构特征构建这两种特征的特征矩阵;融合文本特征矩阵和结构特征矩阵得到本代码片段的代码特征矩阵;从查询的语句中提取相关特征构建查询特征矩阵;利用代码特征矩阵和查询特征矩阵建立代码与查询的相关矩阵;通过计算相关矩阵得到所需的向量参数,最后根据向量参数与特征矩阵得出与查询语句最匹配的代码片段。

    一种恶性肿瘤合并静脉血栓栓塞症风险预测方法

    公开(公告)号:CN113674864A

    公开(公告)日:2021-11-19

    申请号:CN202111007447.8

    申请日:2021-08-30

    Applicant: 重庆大学

    Abstract: 本发明公开了一种恶性肿瘤合并静脉血栓栓塞症风险预测方法,该方法首先对采集的病人信息进行预处理得到基础数据集,再进行双向联合重采样得到训练集,然后对训练集中每个训练样本进行特征筛选,去掉冗余特征;构建和训练StackingXgbMlp模型,该模型包括两层,第一层包括并联的一个XGBoost模型和一个MLP模型,第二层包括一个XGBoost模型;训练完成后将未知是否患病的病人信息采用S100的方法进行预处理,再采用S300的方法进行特征筛选得到待预测样本,将该待预测样本输入训练好的StackingXgbMlp模型中,输出待预测样本患病的预测概率。实验表明,本发明方法在预测准确性比传统方法好。

Patent Agency Ranking