一种结构化预测任务中大模型幻觉的消除方法、设备及介质

    公开(公告)号:CN119647592A

    公开(公告)日:2025-03-18

    申请号:CN202411708934.0

    申请日:2024-11-27

    Abstract: 本申请涉及计算机技术应用领域,具体涉及一种结构化预测任务中大模型幻觉的消除方法、设备及介质。本申请方案根据任务属性类别配置模型集合并行处理机制,将多路大模型结果合并到判别筛选引擎进行量化评估,通过调整引擎参数和预设阈值控制输出的期望,从而让任务的执行结果更符合实际需求。利用大模型幻觉本身具有的随机性,在出现幻觉的任务结果中,形成对大模型幻觉的自动化纠错能力,降低幻觉现象对预测任务的不良影响。进一步地,提供基于信息熵的可信度量计算及结果筛选优化方案,利用信息熵可以更好地筛选出与目标问题相关的特征,提升任务执行的效率,并消除了部分模型可能产生幻觉现象的影响,提升了任务执行结果的准确率。

    一种层次多标签场景的联邦学习方法

    公开(公告)号:CN117556889A

    公开(公告)日:2024-02-13

    申请号:CN202311537400.1

    申请日:2023-11-17

    Abstract: 本发明公开的层次多标签场景的联邦学习方法,在层次多标签场景下通过获取到的标签类型构建有向无环图,并记录各客户端标签类型所在的有向无环图的层次,根据样本数据的特征和有向无环图来构建特征处理模型,其特征处理模型可获取不同层次的激活值,且各客户端可以通过自身所在层次获得对应层次的激活值,从而能够支撑后续的计算流程;然后通过计算无标签激活值的伪标签交叉熵损失,保证训练数据中有标签和无标签数据均有梯度回传,从而保护数据隐私,另外,通过计算相邻层次之间的相关性图的均方差损失,低层次客户端得以指导高层次客户端的参数优化,达到联邦学习的效果,从而提升了联邦学习在层次多标签场景下的安全可用性。

Patent Agency Ranking