一种基于深度强化学习A3C算法的HEV能量管理方法

    公开(公告)号:CN111731303B

    公开(公告)日:2021-04-23

    申请号:CN202010657917.4

    申请日:2020-07-09

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于深度强化学习A3C算法的HEV能量管理方法,属于新能源汽车领域。该方法包括:S1:根据工况的特征参数划分车辆行驶标准工况;S2:计算整车的需求功率;S3:确定需要的状态变量、动作变量以及奖励函数;S4:建立A3C算法模型,设定环境‑智能体模块;S5:根据电池SOC以及需求功率的大小,设计并加入基于规则的发动机启停策略;S6:环境‑智能体模块中分别加载不同类型的标准工况,通过不断迭代试错的学习方式训练算法模型中的深度神经网络,当总奖励处于稳定收敛状态后结束训练过程,并且保存全局神经网络的持久化模型。本发明在保证燃油经济性的条件下实现对所有随机工况的自适应能力。

    一种基于深度强化学习A3C算法的HEV能量管理方法

    公开(公告)号:CN111731303A

    公开(公告)日:2020-10-02

    申请号:CN202010657917.4

    申请日:2020-07-09

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于深度强化学习A3C算法的HEV能量管理方法,属于新能源汽车领域。该方法包括:S1:根据工况的特征参数划分车辆行驶标准工况;S2:计算整车的需求功率;S3:确定需要的状态变量、动作变量以及奖励函数;S4:建立A3C算法模型,设定环境-智能体模块;S5:根据电池SOC以及需求功率的大小,设计并加入基于规则的发动机启停策略;S6:环境-智能体模块中分别加载不同类型的标准工况,通过不断迭代试错的学习方式训练算法模型中的深度神经网络,当总奖励处于稳定收敛状态后结束训练过程,并且保存全局神经网络的持久化模型。本发明在保证燃油经济性的条件下实现对所有随机工况的自适应能力。

    面向混合动力汽车的深度强化学习型具身智能方法

    公开(公告)号:CN119442878A

    公开(公告)日:2025-02-14

    申请号:CN202411509352.X

    申请日:2024-10-28

    Applicant: 重庆大学

    Abstract: 本发明涉及一种面向混合动力汽车的深度强化学习型具身智能方法,属于新能源汽车与人工智能的交叉领域。该方法包括:S1:自定义离线训练与建模在线测试方案;S2:构建实时驾驶环境BEV感知方案;在自动驾驶仿真软件中加载离线训练场景与自定义测试地图,并根据nuScenes数据集配置摄像机;完成场景、车辆及传感器建模后,基于BEV Fusion算法对关键交通要素进行分割与检测;S3:通过BEV Fusion算法获得高维Camera BEV张量,利用深度强化学习算法训练“Alpha HEV具身智能模型”;S4:验证“Alpha HEV具身智能模型”。

    基于地图数据的深度强化学习型混合动力汽车控制方法

    公开(公告)号:CN114312845B

    公开(公告)日:2024-10-22

    申请号:CN202210009502.5

    申请日:2022-01-06

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于地图数据的深度强化学习型混合动力汽车控制方法,属于新能源汽车与智能网联汽车的交叉领域。该方法包括:处理地图数据,建立环境模型;预规划目标速度轨迹;建立车身模型与混合动力系统模型,根据整车动力学对行驶过程进行受力分析并且确定混合动力系统功率平衡关系;车辆转向控制影响分析;建立基于深度确定性策略梯度的混合动力汽车控制策略训练模型,以整车的加速度与转向角以及混合动力系统的发动机与变速器为控制对象,建立控制策略的状态空间、动作空间以及奖励函数,并且进行阶梯式迭代训练过程。本发明能实现混合动力汽车的智能网联化自动驾驶。

    一种深度强化学习型控制策略的自适应性在线提升方法

    公开(公告)号:CN117807714B

    公开(公告)日:2024-07-09

    申请号:CN202410021495.X

    申请日:2024-01-05

    Applicant: 重庆大学

    Abstract: 本发明涉及一种深度强化学习型控制策略的自适应性在线提升方法,属于新能源汽车与人工智能算法的交叉领域。该方法包括:Actor策略网络的初始化训练阶段、多智能体环境的Critic网络预训练阶段、多智能体环境的适配性提升阶段、成熟型Actor策略网络的在线阶段、Actor策略网络的适应性提升阶段和Actor策略网络的适应性预备阶段。本发明针对混合动力汽车与深度强化学习型能量管理策略,提高了深度强化学习型能量管理策略的自适应,解决机器学习型策略由于特殊机理,导致训练阶段的环境模型始终与真实的环境存在一定差异,甚至必然存在的“长尾”效应导致训练过程无法全面覆盖所有场景的问题。

    深度强化学习型能量管理策略的无权重训练及测试方法

    公开(公告)号:CN118092150A

    公开(公告)日:2024-05-28

    申请号:CN202311515188.9

    申请日:2023-11-13

    Applicant: 重庆大学

    Abstract: 本发明涉及一种深度强化学习型能量管理策略的无权重训练以及测试方法,属于新能源汽车与人工智能算法的交叉领域。该方法包括:S1:建立面向离线迭代训练的仿真道路场景,并搭建来自于真实道路的测试场景,同时设计面向短时域行驶范围的实时速度规划方法;S2:针对多种配备单电机的并联混合动力系统构型,建立基于Python环境与Simulink环境的联合仿真训练架构;S3:设计无权重化训练方法,通过消除原先奖励函数中关于瞬时燃料消耗和SOC偏差的优化项后,引入规则型发动机启停策略实现针对SOC变化的维持,并利用发动机最佳运行曲线与燃油消耗率引导深度强化学习型智能体探索最优型能量管理策略;S4:离线仿真训练与测试环节结束后进行硬件在环测试。

    基于路面识别与深度强化学习的混合动力系统控制方法

    公开(公告)号:CN113264031A

    公开(公告)日:2021-08-17

    申请号:CN202110766400.3

    申请日:2021-07-07

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于路面识别与深度强化学习的混合动力系统控制方法,属于新能源汽车的智能控制领域。该方法包括:S1:建立P3结构的并联式混合动力系统以及驾驶环境模型;S2:建立VGG卷积神经网络,采集不同类型路面的图片,并对卷积神经网络进行关于路面类型特征提取的训练;S3:根据滑动率‑附着系数特征曲线确定制动阶段的最优滑动率,并且作为电机转速微调策略的参考值;S4:基于DQN算法建立适用于多目标控制的立体神经网络;S5:定义立体神经网络的状态变量空间、动作变量空间以及奖励函数,并完成迭代训练;S6:提取并保存同步拟合三种参数化控制策略的神经网络,实现混合动力汽车燃油经济性与制动安全性的协同保证。

    一种极端环境下无人车视觉增强装置及方法

    公开(公告)号:CN111756971B

    公开(公告)日:2021-06-29

    申请号:CN202010622342.2

    申请日:2020-06-30

    Applicant: 重庆大学

    Abstract: 本发明涉及一种极端环境下无人车视觉增强装置及方法,属于无人驾驶环境感知领域。该装置包括:图像增强装置,包括滤光装置、图像分析单元和固定装置;滤光装置包括带有后座框的圆形偏振镜,外齿圈,电机驱动单元,以及安装在电机驱动单元上的齿轮;电机驱动单元控制齿轮带动外齿圈及圆形偏振镜同步旋转;图像分析单元输出电机旋转角度和方向信号。本发明通过控制圆形偏振镜的旋转角度实现滤光效果的无级调节,利用卷积神经网络模型和预训练权重参数对图像进行分析,确定圆形偏振镜的旋转角度和方向,同时提出周期扫描方法对圆形偏振镜位置进行校正。

    一种跟车环境下基于深度强化学习的HEV能量管理方法

    公开(公告)号:CN111845701B

    公开(公告)日:2021-03-30

    申请号:CN202010777968.0

    申请日:2020-08-05

    Applicant: 重庆大学

    Abstract: 本发明涉及一种跟车环境下基于深度强化学习的HEV能量管理方法,属于智能混合动力汽车控制领域。该方法包括:基于跟随车的实时车速等信息,确定两车之间的最短安全距离以及最长跟车距离;建立串联式DDPG算法模型,学习跟车速度规划策略以及能量管理控制策略;定义DDPG算法中的变量空间;当每次迭代过程所获得的总奖励值趋于稳定收敛状态并且学习效果较为理想后,结束离线训练过程并且保存持久化模型;制定评价指标,并且利用动态规划算法作为能量管理策略的对比标准。本发明针对具有自动跟车功能的智能混合动力汽车,利用深度强化学习算法,完成跟车环境的速度规划以及传动系统的能量管理,实现整车的综合控制。

Patent Agency Ranking