-
公开(公告)号:CN119670843A
公开(公告)日:2025-03-21
申请号:CN202411834668.6
申请日:2024-12-13
Applicant: 上海大学
Abstract: 本发明涉及一种用于自动驾驶赛车的轨迹引导强化学习方法,包括:模拟赛道环境,并确定描述智能体动态行为的运动模型;设置智能体的动作空间和状态空间;使用TD3算法建立轨迹引导强化学习架构,其中轨迹引导强化学习架构具有评价网络和执行网络;在轨迹引导强化学习架构中引入摩擦系数的不确定性对轨迹引导强化学习架构进行循环训练,使得智能体通过与环境的交互逐步学习如何跟踪轨迹,并适应不同的摩擦系数条件;以及对轨迹引导强化学习架构的评价网络和执行网络的参数进行优化。