一种基于置换偏置与对比解码的智能体动作预测方法

    公开(公告)号:CN119129640A

    公开(公告)日:2024-12-13

    申请号:CN202411056914.X

    申请日:2024-08-02

    Abstract: 本发明公开了一种基于置换偏置与对比解码的智能体动作预测方法,所述方法包括:构建策略生成模型,包括Encoder模块和Decoder模块,获取局部观测向量和动作序列,将局部观测向量输入Encoder模块进行处理,得到智能体的观测表示,并将观测表示传递给Decoder模块,根据观测表示得到观测的智能体状态值函数;将动作序列输入到Decoder模块与观测表示一起进行解码,得到隐向量,将隐向量进行变换得到具有动作置换性的智能体动作集合,将具有动作置换性的智能体动作集合进行对比探索解码,得到执行动作,根据智能体状态值函数和执行动作计算总损失函数,得到目标模型,使用目标模型预测目标智能体的行为。本发明提高了对于目标智能体动作的预测精度。

    基于联邦学习的模型训练方法、系统及相关设备

    公开(公告)号:CN118982063A

    公开(公告)日:2024-11-19

    申请号:CN202411456528.X

    申请日:2024-10-18

    Abstract: 本申请公开了基于联邦学习的模型训练方法、系统及相关设备,涉及计算机技术领域,方法包括:向客户端下发待训练的全局模型,触发各客户端进行模型更新获得前一轮次训练完成后的客户端本地模型,并基于客户端本地数据对客户端本地模型进行模型训练后获得客户端本地训练模型;获取客户端的第一贡献度计算指标值;根据第一贡献函数、共享数据集和客户端的前一轮次训练完成后的客户端本地模型确定第一指标系数;从而确定各客户端的第一贡献度值,并根据第一贡献度值确定目标客户端;根据目标客户端对应的当前轮次的客户端本地训练模型获得当前轮次训练完成后的全局模型。本申请方案有利于提高模型训练的准确性。

    一种内容发现方法、系统、终端及存储介质

    公开(公告)号:CN117743869A

    公开(公告)日:2024-03-22

    申请号:CN202410179740.X

    申请日:2024-02-18

    Abstract: 本发明公开了一种内容发现方法、系统、终端及存储介质,其中,所述方法包括:获取目标品牌信息和目标用户内容生成信息;将视频内容信息输入到视频编码模型中得到视频特征向量,将文本内容信息输入到文本编码模型中得到文本特征向量,将目标品牌信息输入到品牌编码模型中得到品牌语义;采用预先训练完成的得分函数生成目标用户内容生成信息与目标品牌信息的相似度;获取相似度,根据预设的选取阈值从所有的目标用户内容生成信息中选取目标内容信息。本发明通过所述方法,解决了采用单模态的内容发现方法时存在着由于仅利用了图像资料而忽略了文本、话题标签等多模态信息或只利用神经网络提取图像特征而无法利用视频中语义信息的问题。

Patent Agency Ranking