一种基于深度强化学习的多智能体联邦协作方法
Abstract:
本发明公开了一种基于深度强化学习的多智能体联邦协作方法,包括以下步骤:S1、对每个智能体建立深度强化学习模型;S2、为智能体建立对应的神经网络;S3、智能体与环境进行交互,将决策经验存储到经验池中,并且根据随机梯度下降法更新本地的神经网络模型;S4、将本地的神经网络模型参数传给协作平台;S5、对智能体上传的参数进行聚合处理,并将结果返回给各个智能体进行参数更新;S6、智能体进行软更新,得到最新的本地模型参数;S7、重复S3‑S6,直到完成目标任务。本发明的智能体在通过深度强化学习进行环境探索与决策的同时,利用联邦学习技术获取其他智能体学习经验,从而有效地提高智能体学习效率,且降低智能体之间的协作开销。
Patent Agency Ranking
0/0