-
公开(公告)号:CN118363379A
公开(公告)日:2024-07-19
申请号:CN202410394281.7
申请日:2024-04-02
Applicant: 江苏科技大学
IPC: G05D1/43 , G05D109/30
Abstract: 本发明公开了一种基于深度强化学习的无人船动力定位控制方法,包括以下步骤:S1,构建强化学习环境;S2,将无人船作为智能体,建立马尔科夫过程模型,设置无人船动力定位的状态空间、动作空间并设计奖励函数;S3,引入优先经验回放机制并增加评论家网络层数,得到PER‑SAC_3Critics算法;S4,设置训练环境,利用PER‑SAC_3Critics算法训练智能体,得到神经网络模型最优参数;S5,利用训练好的神经网络模型引导无人船在干扰环境下完成动力定位任务。本发明将无人船动力定位控制与强化学习中SAC算法相结合通过对算法的改进,提高了智能体的训练速度、收敛速度和对经验样本的利用效率,实现无人船在环境干扰下稳定、快速、准确、高效的完成动力定位任务。