-
公开(公告)号:CN117270527A
公开(公告)日:2023-12-22
申请号:CN202311173726.0
申请日:2023-09-12
Applicant: 北京理工大学
IPC: G05D1/02
Abstract: 本发明提供了一种面向自动驾驶赛车的极限驾驶规划控制方法,后退式强化学习模块设计难度逐步提升的多阶段强化学习课程,依次利用专家引导策略和强化学习策略完成整个赛道的车辆轨迹规划,并在训练过程中逐步后退提高强化学习策略的应用范围;风险感知变异模块结合好奇心驱动机制和变异算法,通过对关键风险状态和强化学习动作网络进行变异操作,促进强化学习算法学习关键风险状态中蕴含的极限驾驶知识,提升临界风险状态下的鲁棒性和安全性;模型预测控制模块:基于非线性模型预测控制算法生成局部最优控制命令,跟踪后退式强化学习模块提供的目标轨迹,使得满足车辆动力学约束并能够预测潜在风险,可以实现自动驾驶赛车的运动控制。
-
公开(公告)号:CN119568178A
公开(公告)日:2025-03-07
申请号:CN202411409698.2
申请日:2024-10-10
Applicant: 北京理工大学
Abstract: 本发明提供的一种基于最近发展区指导的自动驾驶对抗学习方法,通过综合考虑对抗车辆的个人因素、对抗性因素和自车的理想回报上限,保证生成的对抗性任务在具有挑战性的同时是可解的,而且符合交通规则,有效促进了自车代理的学习和适应;其次,引入了“车辆潜在威胁性”概念,基于ZPD理论实现了损失函数各约束项之间比重系数的动态调整,以在训练过程中自适应地改变任务难度,促进自车更快地学习;最后,提出了碰撞分析方法,通过车身碰撞点、碰撞角度和碰撞速度因素评估碰撞的严重程度,计算碰撞损失值,并将其纳入自车和对抗代理的损失函数中,确保模型根据详细的碰撞风险更新其参数。
-
公开(公告)号:CN117325860A
公开(公告)日:2024-01-02
申请号:CN202311172439.8
申请日:2023-09-12
Applicant: 北京理工大学
IPC: B60W30/18 , B60W60/00 , B60W30/095
Abstract: 本发明公开了一种密集交通场景下自动驾驶车辆换道规划控制方法,交互式强化学习模块考虑环境不确定性、车辆安全约束和车辆交互异质性,基于强化学习算法生成密集交通场景下自动驾驶汽车交互式换道的目标轨迹;通过引入先验驾驶知识,识别并调节交互式强化学习模块生成的不安全运动规划策略,并将修正后的运动规划策略传递给运动跟踪控制模块;基于非线性模型预测控制算法生成局部最优控制命令,跟踪交互式强化学习模块提供的目标轨迹,使得满足车辆动力学约束并能够预测潜在风险;本发明方法可以与各种传感器和执行器配合使用,获取环境信息和周围车辆状态信息;还可以与制动器、油门、转向器等执行器配合使用,以实现自动驾驶车辆的运动控制。
-
公开(公告)号:CN118536793A
公开(公告)日:2024-08-23
申请号:CN202410321134.7
申请日:2024-03-20
Applicant: 北京理工大学
Abstract: 本发明提供了一种感知盲区场景下自动驾驶车辆风险评估及交互规划系统,上层风险评估模块:结合了专家知识的图注意力网络MDN,用于预测感知盲区不确定潜在风险的概率分布,通过引入专家先验知识,利用GAT技术捕获复杂的车辆交互动态;同时利用MDN生成潜在车辆的概率状态分布,提供关于遮挡区域内潜在风险的定量评估;下层交互式规划模块提出自适应损失函数强化学习ALERL)算法生成考虑盲区不确定风险的交互运动规划策略,通过引入自适应辅助损失函数AALF,综合考虑了盲区潜在风险的预测准确性、条件风险价值以及对车辆交互探索的鼓励。
-
-
-