-
公开(公告)号:CN113246958A
公开(公告)日:2021-08-13
申请号:CN202110654498.3
申请日:2021-06-11
Applicant: 武汉理工大学
Abstract: 公开了一种基于双延迟深度确定性策略梯度多目标HEV能量管理方法及系统。本发明创新地使用双延迟深度确定性策略梯度策略,解决基于离散动作空间深度强化学习能量管理策略维度灾难问题和深度确定性策略梯度过估计问题。而且将燃油消耗、电池温度和电池寿命(SOH)作为优化目标,提高能量管理策略的实用价值。
-
公开(公告)号:CN112440974B
公开(公告)日:2021-11-02
申请号:CN202011355903.3
申请日:2020-11-27
Applicant: 武汉理工大学
Abstract: 本发明属于混合动力汽车能量管理技术领域,公开了基于分布式深度确定性策略梯度的HEV能量管理方法,包括获取混合动力汽车的状态需求信息;将状态需求信息作为输入量,基于神经网络构建回报函数;基于回报函数,构建分布式深度确定性策略梯度控制器;训练分布式深度确定性策略梯度控制器,获得稳定状态下的控制动作参数;通过训练好的分布式深度确定性策略梯度控制器执行能量管理策略。本发明解决了现有技术中HEV能量管理方法无法高效地适应于所有类型的道路工况、实时性较差的问题。本发明可以很大程度提高算法的实时性并且适用于多种道路工况。
-
公开(公告)号:CN114852043B
公开(公告)日:2024-06-18
申请号:CN202210298825.0
申请日:2022-03-23
Applicant: 武汉理工大学
Abstract: 本发明属于混合动力车辆能量管理技术领域,公开了一种基于分层回报TD3的HEV能量管理方法及系统。本发明结合并联式混合动力车辆模型选取HEV能量管理策略的状态空间信号和动作空间信号,并采用分层回报结构,分层回报结构包括两种回报函数,共计四个调节层,可以根据车辆的不同行驶状态针对性调整控制策略,减少不必要的重复探索行为,提高能量管理策略整体性能。
-
公开(公告)号:CN114852043A
公开(公告)日:2022-08-05
申请号:CN202210298825.0
申请日:2022-03-23
Applicant: 武汉理工大学
Abstract: 本发明属于混合动力车辆能量管理技术领域,公开了一种基于分层回报TD3的HEV能量管理方法及系统。本发明结合并联式混合动力车辆模型选取HEV能量管理策略的状态空间信号和动作空间信号,并采用分层回报结构,分层回报结构包括两种回报函数,共计四个调节层,可以根据车辆的不同行驶状态针对性调整控制策略,减少不必要的重复探索行为,提高能量管理策略整体性能。
-
公开(公告)号:CN119872510A
公开(公告)日:2025-04-25
申请号:CN202510061473.0
申请日:2025-01-15
Applicant: 武汉理工大学
Abstract: 本发明公开了一种并联混合动力车辆能量管理方法和装置,方法包括:获取初始车辆状态信号;构建车辆动力学方程;根据车辆动力学方程,构建并联混合动力车辆结构模型;根据并联混合动力车辆结构模型,构建电池热模型和电池寿命模型;根据电池热模型和电池寿命模型,构建无参数回报函数;根据无参数回报函数,生成强化学习空间状态和强化学习控制动作;构建目标双延迟深度确定性策略梯度网络;构建车辆能量管理学习策略;根据初始车辆状态信号,利用车辆能量管理学习策略确定目标发动机等效转矩,目标发动机等效转矩用于控制发动机运行。本发明实现了并联混合动力车辆能量管理,提高了准确度、适用性和效率。本发明可广泛应用于车辆工程技术领域。
-
公开(公告)号:CN113246958B
公开(公告)日:2022-06-14
申请号:CN202110654498.3
申请日:2021-06-11
Applicant: 武汉理工大学
Abstract: 公开了一种基于双延迟深度确定性策略梯度多目标HEV能量管理方法及系统。本发明创新地使用双延迟深度确定性策略梯度策略,解决基于离散动作空间深度强化学习能量管理策略维度灾难问题和深度确定性策略梯度过估计问题。而且将燃油消耗、电池温度和电池寿命(SOH)作为优化目标,提高能量管理策略的实用价值。
-
公开(公告)号:CN112440974A
公开(公告)日:2021-03-05
申请号:CN202011355903.3
申请日:2020-11-27
Applicant: 武汉理工大学
Abstract: 本发明属于混合动力汽车能量管理技术领域,公开了基于分布式深度确定性策略梯度的HEV能量管理方法,包括获取混合动力汽车的状态需求信息;将状态需求信息作为输入量,基于神经网络构建回报函数;基于回报函数,构建分布式深度确定性策略梯度控制器;训练分布式深度确定性策略梯度控制器,获得稳定状态下的控制动作参数;通过训练好的分布式深度确定性策略梯度控制器执行能量管理策略。本发明解决了现有技术中HEV能量管理方法无法高效地适应于所有类型的道路工况、实时性较差的问题。本发明可以很大程度提高算法的实时性并且适用于多种道路工况。
-
-
-
-
-
-