一种基于深度强化学习的多智能体联邦协作方法

Invention Publication

CN112465151A 一种基于深度强化学习的多智能体联邦协作方法审中-公开

Please log in to see more content

Patent Title: 一种基于深度强化学习的多智能体联邦协作方法
Application No.: CN202011490926.5

Application Date: 2020-12-17
Publication No.: CN112465151A

Publication Date: 2021-03-09
Inventor: 韦云凯 , 周思佩 , 冷甦鹏 , 杨鲲 , 刘强 , 沈军
Applicant: 电子科技大学长三角研究院(衢州)
Applicant Address: 浙江省衢州市柯城区芹江东路288号1幢18楼
Assignee: 电子科技大学长三角研究院(衢州)
Current Assignee: 电子科技大学长三角研究院(衢州)
Current Assignee Address: 浙江省衢州市柯城区芹江东路288号1幢18楼
Agency: 成都虹盛汇泉专利代理有限公司
Agent 王伟
Main IPC: G06N20/00
IPC: G06N20/00 ; G06F8/65

Abstract:

本发明公开了一种基于深度强化学习的多智能体联邦协作方法，包括以下步骤：S1、对每个智能体建立深度强化学习模型；S2、为智能体建立对应的神经网络；S3、智能体与环境进行交互，将决策经验存储到经验池中，并且根据随机梯度下降法更新本地的神经网络模型；S4、将本地的神经网络模型参数传给协作平台；S5、对智能体上传的参数进行聚合处理，并将结果返回给各个智能体进行参数更新；S6、智能体进行软更新，得到最新的本地模型参数；S7、重复S3‑S6，直到完成目标任务。本发明的智能体在通过深度强化学习进行环境探索与决策的同时，利用联邦学习技术获取其他智能体学习经验，从而有效地提高智能体学习效率，且降低智能体之间的协作开销。

Information query

Chinese Patent Announcement Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06N	基于特定计算模型的计算机系统
G06N20/00	机器学习