-
公开(公告)号:CN113189879B
公开(公告)日:2022-07-15
申请号:CN202110505118.X
申请日:2021-05-10
Applicant: 中国科学技术大学
Abstract: 本发明提供一种控制策略的确定方法及装置、存储介质及电子设备,该方法包括,获取多组系统数据,确定第一神经网络和第二神经网络,及第一神经网络对应的第一权重更新策略,和第二神经网络对应的第二权重更新策略。通过各组系统数据、第一权重更新策略及第二权重更新策略,分别对第一神经网络及第二神经网络进行训练,使得训练后的第一神经网络符合预设的第一收敛条件,且训练后的第二神经网络符合预设的第二收敛条件;以训练后的第一神经网络和训练后的第二神经网络,配置控制器,以使控制器在被控系统运行过程中,根据被控系统的实时系统状态,向被控系统输入控制信号。应用本发明的方法,无需求解复杂的贝尔曼方程,可便捷地确定控制策略。
-
公开(公告)号:CN113189879A
公开(公告)日:2021-07-30
申请号:CN202110505118.X
申请日:2021-05-10
Applicant: 中国科学技术大学
Abstract: 本发明提供一种控制策略的确定方法及装置、存储介质及电子设备,该方法包括,获取多组系统数据,确定第一神经网络和第二神经网络,及第一神经网络对应的第一权重更新策略,和第二神经网络对应的第二权重更新策略。通过各组系统数据、第一权重更新策略及第二权重更新策略,分别对第一神经网络及第二神经网络进行训练,使得训练后的第一神经网络符合预设的第一收敛条件,且训练后的第二神经网络符合预设的第二收敛条件;以训练后的第一神经网络和训练后的第二神经网络,配置控制器,以使控制器在被控系统运行过程中,根据被控系统的实时系统状态,向被控系统输入控制信号。应用本发明的方法,无需求解复杂的贝尔曼方程,可便捷地确定控制策略。
-