Invention Publication
- Patent Title: 一种基于深度强化学习的多智能体联邦协作方法
-
Application No.: CN202011490926.5Application Date: 2020-12-17
-
Publication No.: CN112465151APublication Date: 2021-03-09
- Inventor: 韦云凯 , 周思佩 , 冷甦鹏 , 杨鲲 , 刘强 , 沈军
- Applicant: 电子科技大学长三角研究院(衢州)
- Applicant Address: 浙江省衢州市柯城区芹江东路288号1幢18楼
- Assignee: 电子科技大学长三角研究院(衢州)
- Current Assignee: 电子科技大学长三角研究院(衢州)
- Current Assignee Address: 浙江省衢州市柯城区芹江东路288号1幢18楼
- Agency: 成都虹盛汇泉专利代理有限公司
- Agent 王伟
- Main IPC: G06N20/00
- IPC: G06N20/00 ; G06F8/65

Abstract:
本发明公开了一种基于深度强化学习的多智能体联邦协作方法,包括以下步骤:S1、对每个智能体建立深度强化学习模型;S2、为智能体建立对应的神经网络;S3、智能体与环境进行交互,将决策经验存储到经验池中,并且根据随机梯度下降法更新本地的神经网络模型;S4、将本地的神经网络模型参数传给协作平台;S5、对智能体上传的参数进行聚合处理,并将结果返回给各个智能体进行参数更新;S6、智能体进行软更新,得到最新的本地模型参数;S7、重复S3‑S6,直到完成目标任务。本发明的智能体在通过深度强化学习进行环境探索与决策的同时,利用联邦学习技术获取其他智能体学习经验,从而有效地提高智能体学习效率,且降低智能体之间的协作开销。
Information query