-
公开(公告)号:CN117591647A
公开(公告)日:2024-02-23
申请号:CN202311555457.4
申请日:2023-11-21
Applicant: 重庆大学
IPC: G06F16/332 , G06F16/31 , G06F16/33 , G06N3/0464 , G06N3/08 , G06N5/04
Abstract: 本发明涉及一种预训练代码增强的编程问答社区答案推荐方法,分为两个阶段,训练阶段和推荐阶段。训练阶段可分为标签推荐预训练阶段和问答分类微调阶段,其中标签推荐预训练模型使用问题中的标题、主体、代码信息作为输入,以问题标签作为真值进行学习;在微调阶段,复用预训练模型,分别对问题和答案中的信息进行编码,最后将问题和答案的特征向量映射到分类空间中。推荐阶段对于一个新问题,先使用搜索引擎查询相似的问题标题,取前Q个作为候选问题,并确定候选答案,将候选答案与新问题作为微调过的模型的输入,得到每对问答的分类的置信概率,通过加权求和的方式计算问答的匹配得分,排序之后前Q’为最终的推荐答案。
-
公开(公告)号:CN112800172A
公开(公告)日:2021-05-14
申请号:CN202110167463.7
申请日:2021-02-07
Applicant: 重庆大学
Abstract: 本发明公开了一种基于两阶段注意力机制的代码搜索方法,具体包括如下步骤:选取一代码片段,从代码片段中所包含的函数名和函数体中提取文本特征及结构特征;根据所提取的文本特征和结构特征构建这两种特征的特征矩阵;融合文本特征矩阵和结构特征矩阵得到本代码片段的代码特征矩阵;从查询的语句中提取相关特征构建查询特征矩阵;利用代码特征矩阵和查询特征矩阵建立代码与查询的相关矩阵;通过计算相关矩阵得到所需的向量参数,最后根据向量参数与特征矩阵得出与查询语句最匹配的代码片段。
-
公开(公告)号:CN113674864B
公开(公告)日:2023-08-11
申请号:CN202111007447.8
申请日:2021-08-30
Applicant: 重庆大学
IPC: G16H50/30 , G16H50/70 , G06F18/2415 , G06F18/214 , G06F18/25
Abstract: 本发明公开了一种恶性肿瘤合并静脉血栓栓塞症风险预测方法,该方法首先对采集的病人信息进行预处理得到基础数据集,再进行双向联合重采样得到训练集,然后对训练集中每个训练样本进行特征筛选,去掉冗余特征;构建和训练StackingXgbMlp模型,该模型包括两层,第一层包括并联的一个XGBoost模型和一个MLP模型,第二层包括一个XGBoost模型;训练完成后将未知是否患病的病人信息采用S100的方法进行预处理,再采用S300的方法进行特征筛选得到待预测样本,将该待预测样本输入训练好的StackingXgbMlp模型中,输出待预测样本患病的预测概率。实验表明,本发明方法在预测准确性比传统方法好。
-
公开(公告)号:CN112328912B
公开(公告)日:2023-05-19
申请号:CN202011210800.8
申请日:2020-11-03
Applicant: 重庆大学
IPC: G06Q10/04 , G06F16/9537 , G06F16/9536 , G06F17/16 , G06N3/0499 , G06N3/08 , G06F18/214 , G06F18/27
Abstract: 本发明涉及通信技术领域,具体涉及一种利用地点感知的QoS预测方法。本发明以用户、服务以及他们的地点信息为特征作为预测模型的输入,预测模型将输入特征映射成为高维稠密向量,并利用特征重用的方式实现对QoS值的预测。该方法在网络深度较深的情况下缓解了梯度消失和特征丢失的问题,相比现有技术,在稀疏数据的情况下,能够更加准确的预测出用户调用服务的QoS值。
-
公开(公告)号:CN112800172B
公开(公告)日:2022-07-12
申请号:CN202110167463.7
申请日:2021-02-07
Applicant: 重庆大学
Abstract: 本发明公开了一种基于两阶段注意力机制的代码搜索方法,具体包括如下步骤:选取一代码片段,从代码片段中所包含的函数名和函数体中提取文本特征及结构特征;根据所提取的文本特征和结构特征构建这两种特征的特征矩阵;融合文本特征矩阵和结构特征矩阵得到本代码片段的代码特征矩阵;从查询的语句中提取相关特征构建查询特征矩阵;利用代码特征矩阵和查询特征矩阵建立代码与查询的相关矩阵;通过计算相关矩阵得到所需的向量参数,最后根据向量参数与特征矩阵得出与查询语句最匹配的代码片段。
-
公开(公告)号:CN112328912A
公开(公告)日:2021-02-05
申请号:CN202011210800.8
申请日:2020-11-03
Applicant: 重庆大学
IPC: G06F16/9537 , G06F16/9536 , G06N3/04 , G06N3/08 , G06F17/16 , G06F17/18 , G06Q10/04 , G06Q10/06 , G06Q50/30
Abstract: 本发明涉及通信技术领域,具体涉及一种利用地点感知的QoS预测方法。本发明以用户、服务以及他们的地点信息为特征作为预测模型的输入,预测模型将输入特征映射成为高维稠密向量,并利用特征重用的方式实现对QoS值的预测。该方法在网络深度较深的情况下缓解了梯度消失和特征丢失的问题,相比现有技术,在稀疏数据的情况下,能够更加准确的预测出用户调用服务的QoS值。
-
公开(公告)号:CN116564537A
公开(公告)日:2023-08-08
申请号:CN202310559667.4
申请日:2023-05-18
Applicant: 重庆大学附属肿瘤医院
IPC: G16H50/70 , G06F40/295 , G06F18/213 , G06F18/2413 , G06F18/25 , G06F18/214 , G06N20/00
Abstract: 本发明公开了一种基于机器学习的恶性肿瘤合并VTE风险预测方法,包括如下步骤:获取患者电子病历体征数据和文本数据,进行预处理后进行数据集成;对平衡后的数据进行多指标联合特征筛选,基于XGBoost的特征排序,利用Weight、Cover、Gain三个指标的几何平均值作为排序指标,得到对VTE预测影响较大的特征组合;构建和训练命名实体识别模型REGPS;利用FastText对提取到的患者实体进行词嵌入,将嵌入后得到的特征矩阵X与特征筛选后得到的体征特征组合Y进行特征融合拼接得到患者总体特征矩阵Einput;将Einput输入经过调优后的XGBoost模型,最终得到恶性肿瘤患者合并VTE概率。
-
公开(公告)号:CN113674864A
公开(公告)日:2021-11-19
申请号:CN202111007447.8
申请日:2021-08-30
Applicant: 重庆大学
Abstract: 本发明公开了一种恶性肿瘤合并静脉血栓栓塞症风险预测方法,该方法首先对采集的病人信息进行预处理得到基础数据集,再进行双向联合重采样得到训练集,然后对训练集中每个训练样本进行特征筛选,去掉冗余特征;构建和训练StackingXgbMlp模型,该模型包括两层,第一层包括并联的一个XGBoost模型和一个MLP模型,第二层包括一个XGBoost模型;训练完成后将未知是否患病的病人信息采用S100的方法进行预处理,再采用S300的方法进行特征筛选得到待预测样本,将该待预测样本输入训练好的StackingXgbMlp模型中,输出待预测样本患病的预测概率。实验表明,本发明方法在预测准确性比传统方法好。
-
-
-
-
-
-
-