高维空间中强化学习型控制策略的安全评估与应用方法

    公开(公告)号:CN118444659B

    公开(公告)日:2025-02-11

    申请号:CN202410528558.0

    申请日:2024-04-29

    Applicant: 重庆大学

    Abstract: 本发明涉及一种高维空间中强化学习型控制策略的安全评估与应用方法,隶属于新能源汽车与人工智能的交叉领域。该方法包括:S1:定义归一化状态空间、动作空间与奖励函数,引导智能体掌握当前训练环境下的近优或者最优控制策略,并保存实时生成的训练样本;S2:搭建现阶段与神经网络型近优或最优控制策略模型相对应且保持稳定控制可靠性的高维已知状态空间;S3:以高维历史状态空间为基准并且以单簇的聚类结果为中心,提出判断窗以及隶属度概念,明确在何种状态张量的数据驱动下具有可靠性且满足最优控制效果;S4:强化采集边界与陌生区域的状态转移样本,构建面向真实且陌生的环境样本集,用于提升深度强化学习型策略的适用性与安全性。

    一种实现自动驾驶车辆安全决策控制的方法

    公开(公告)号:CN114644017A

    公开(公告)日:2022-06-21

    申请号:CN202210486621.X

    申请日:2022-05-06

    Applicant: 重庆大学

    Abstract: 本发明涉及一种实现自动驾驶车辆安全决策控制的方法,属于自动驾驶汽车领域。该方法包括:S1:构建基于深度强化学习的决策模型及其不确定性评估方法,包括构建汽车运动学模型、状态空间、动作空间、构建奖励函数;构建并训练基于深度强化学习的决策模型;S2:构建危险场景下的混合安全决策模型。本发明可以输出决策模型的不确定性,帮助自动驾驶车辆识别出决策危险场景,并可以在车辆面临决策危险场景时采取备选安全策略,提升自动驾驶车辆安全性。

    一种混合动力汽车横向纵向协同综合效率优化方法

    公开(公告)号:CN118529018B

    公开(公告)日:2025-01-24

    申请号:CN202410595369.5

    申请日:2024-05-14

    Applicant: 重庆大学

    Abstract: 本发明涉及一种混合动力汽车横向纵向协同综合效率优化方法,属于新能源汽车节能技术领域。该方法包括:S1:构建多车道动态交通模型,获取自车和周围交通参与者状态信息;S2:将历史车辆状态信息分为舍弃集和预测集,使用动态模式分解算法基于预测集进行多车道交通流预测,获得各车道速度加权值;S3:将车辆状态信息和车道交通流预测信息作为优先经验回放DDQN算法输入,进行自车的变道决策和车速规划;S4:根据车辆构型,构建自车动力系统模型,建立车辆不同动力源之间的能量流分配关系;S5:将规划的车速轨迹作为深度强化学习算法输入,计算车辆需求功率和需求转矩,在燃油消耗最小化约束下,进行自车动力系统中能量流的分配优化。

    一种混合动力汽车能量与热管理多智能体协同控制方法

    公开(公告)号:CN118124333A

    公开(公告)日:2024-06-04

    申请号:CN202410434357.4

    申请日:2024-04-11

    Applicant: 重庆大学

    Abstract: 本发明涉及一种混合动力汽车能量与热管理多智能体协同控制方法,属于新能源汽车技术领域,包括以下步骤:S1:建立混合动力汽车的动力系统与热管理系统的控制模型;S2:建立智能体与状态空间、控制维度之间的映射关系,设计对应的奖励函数;S3:建立基于多智能体深度强化学习算法的混合动力汽车热管理与能量管理的协同控制框架,求解包含燃油经济性、动力电池健康度、座舱热舒适性的多目标优化问题。本发明利用多智能体深度强化学习算法解决多目标优化问题,通过多个策略网络指导智能体,实现动力系统与空调系统的自适应协调控制,提高整车能源利用效率。

    基于路面识别与深度强化学习的混合动力系统控制方法

    公开(公告)号:CN113264031B

    公开(公告)日:2022-04-29

    申请号:CN202110766400.3

    申请日:2021-07-07

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于路面识别与深度强化学习的混合动力系统控制方法,属于新能源汽车的智能控制领域。该方法包括:S1:建立P3结构的并联式混合动力系统以及驾驶环境模型;S2:建立VGG卷积神经网络,采集不同类型路面的图片,并对卷积神经网络进行关于路面类型特征提取的训练;S3:根据滑动率‑附着系数特征曲线确定制动阶段的最优滑动率,并且作为电机转速微调策略的参考值;S4:基于DQN算法建立适用于多目标控制的立体神经网络;S5:定义立体神经网络的状态变量空间、动作变量空间以及奖励函数,并完成迭代训练;S6:提取并保存同步拟合三种参数化控制策略的神经网络,实现混合动力汽车燃油经济性与制动安全性的协同保证。

    一种基于深度强化学习算法的燃料电池汽车能量管理方法

    公开(公告)号:CN112287463B

    公开(公告)日:2022-02-11

    申请号:CN202011212191.X

    申请日:2020-11-03

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于深度强化学习算法的燃料电池汽车能量管理方法,属于新能源汽车领域。该方法包括:S1:获取燃料电池汽车状态信息;S2:搭建燃料电池汽车能量管理系统模型;S3:利用深度强化学习算法构建燃料电池汽车能量管理策略,求解包含燃油经济性以及燃料电池效率的多目标优化问题,从而得出最优能量分配结果。本发明将深度强化学习算法应用于燃料电池汽车能量管理制,具有良好的优化性以及实时性;同时在奖励函数中考虑了燃料电池的工作效率,为能量管理提供了新思路。

    一种极端环境下无人车视觉增强装置及方法

    公开(公告)号:CN111756971A

    公开(公告)日:2020-10-09

    申请号:CN202010622342.2

    申请日:2020-06-30

    Applicant: 重庆大学

    Abstract: 本发明涉及一种极端环境下无人车视觉增强装置及方法,属于无人驾驶环境感知领域。该装置包括:图像增强装置,包括滤光装置、图像分析单元和固定装置;滤光装置包括带有后座框的圆形偏振镜,外齿圈,电机驱动单元,以及安装在电机驱动单元上的齿轮;电机驱动单元控制齿轮带动外齿圈及圆形偏振镜同步旋转;图像分析单元输出电机旋转角度和方向信号。本发明通过控制圆形偏振镜的旋转角度实现滤光效果的无级调节,利用卷积神经网络模型和预训练权重参数对图像进行分析,确定圆形偏振镜的旋转角度和方向,同时提出周期扫描方法对圆形偏振镜位置进行校正。

    一种深度强化学习型控制策略的自适应性在线提升方法

    公开(公告)号:CN117807714A

    公开(公告)日:2024-04-02

    申请号:CN202410021495.X

    申请日:2024-01-05

    Applicant: 重庆大学

    Abstract: 本发明涉及一种深度强化学习型控制策略的自适应性在线提升方法,属于新能源汽车与人工智能算法的交叉领域。该方法包括:Actor策略网络的初始化训练阶段、多智能体环境的Critic网络预训练阶段、多智能体环境的适配性提升阶段、成熟型Actor策略网络的在线阶段、Actor策略网络的适应性提升阶段和Actor策略网络的适应性预备阶段。本发明针对混合动力汽车与深度强化学习型能量管理策略,提高了深度强化学习型能量管理策略的自适应,解决机器学习型策略由于特殊机理,导致训练阶段的环境模型始终与真实的环境存在一定差异,甚至必然存在的“长尾”效应导致训练过程无法全面覆盖所有场景的问题。

    一种基于概率修正的驾驶员意图识别方法

    公开(公告)号:CN111717217B

    公开(公告)日:2022-11-08

    申请号:CN202010624121.9

    申请日:2020-06-30

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于概率修正的驾驶员意图识别方法,属于无人驾驶汽车领域。该方法包括:S1:采集驾驶行为的数据,并预处理;S2:获取环境道路信息,选取特征数据,并用MGHMM模型进行驾驶员意图的初步识别,计算得到观测序列对应于各驾驶员意图模型初始概率;S3:结合环境道路信息和采集的驾驶员数据对驾驶员意图模型初始概率P1进行修正,分别得到修正概率P2和P3;S4:将修正后的驾驶员意图模型概率输入PSO‑SVM分类器进行分类识别,辨识出最终的驾驶员意图。本发明大大提高了驾驶员意图识别的精度和实用性。利用本发明可进行驾驶员辅助系统的开发设计,实现无人驾驶汽车的人车协同控制。

Patent Agency Ranking