-
公开(公告)号:CN115097852A
公开(公告)日:2022-09-23
申请号:CN202210834903.4
申请日:2022-07-15
Applicant: 河海大学常州校区
Abstract: 本发明公开了一种基于博弈论的AUV水下集群攻防优化方法,包括如下步骤:(1)、根据情景建立二维围捕或对抗模拟环境框架;(2)、让智能体与模拟环境进行实时交互产生数据,将产生的数据存入经验回放池直至填满;(3)、待经验回放池数据存储达到上限,采用GRU单元的值函数分解算法对智能体进行训练;(4)、将训练好的智能体放入环境中进行交互,得出训练结果。本发明解决了传统算法不能较好收敛的问题,针对传统协同对抗问题需要根据任务选择不同算法的局限,改进后的算法则具有较强的通用性,可以在不同的任务中使用,并都可以获得不错的效果。