-
公开(公告)号:CN114859734B
公开(公告)日:2024-06-07
申请号:CN202210675362.5
申请日:2022-06-15
Applicant: 厦门大学
Abstract: 本发明涉及一种基于改进SAC算法的温室环境参数优化决策方法,包括以下步骤:S1,将温室状态数据、温室环境参数决策数据、温室产出数据作为SAC算法的强化学习要素,利用历史人工种植经验数据提前填充经验缓冲区;S2,生成温室模拟器用于模拟温室种植过程;S3,设计SAC算法批判者神经网络的数量,设计SAC算法行动者神经网络的目标函数,得到改进SAC算法;S4,利用所述改进SAC算法生成新的温室环境参数决策数据,将所述新的温室环境参数决策数据输入所述温室模拟器进行新的种植周期,数据放入经验缓冲区,利用经验缓冲区数据更新所述批判者神经网络的参数和行动者神经网络的参数;S5,重复执行步骤S4,直至完成若干种植周期,得到神经网络。
-
公开(公告)号:CN113050412B
公开(公告)日:2023-03-21
申请号:CN202110255704.3
申请日:2021-03-09
Applicant: 厦门大学
IPC: G05B13/02
Abstract: 本发明涉及一种基于迭代学习控制的批次反应釜控制方法的生成方法,所述迭代学习控制包含迭代学习控制算法和强化学习算法,所述方法包含以下步骤:S1,调试批次反应釜;S2,通过迭代学习控制算法对所述批次反应釜进行多批次的轨迹跟踪;采集所述批次反应釜的多批次数据并存入经验回放池中;S3,通过强化学习控制算法提取所述多批次数据,生成初始控制策略;S4,通过强化学习控制算法对所述批次反应釜实时轨迹跟踪;采集所述批次反应釜的实时数据并存入经验回放池中;S5,通过强化学习控制算法利用所述多批次数据和所述实时数据对所述初始控制策略进行多次更新优化,直到得到稳定控制策略。
-
公开(公告)号:CN114859734A
公开(公告)日:2022-08-05
申请号:CN202210675362.5
申请日:2022-06-15
Applicant: 厦门大学
Abstract: 本发明涉及一种基于改进SAC算法的温室环境参数优化决策方法,包括以下步骤:S1,将温室状态数据、温室环境参数决策数据、温室产出数据作为SAC算法的强化学习要素,利用历史人工种植经验数据提前填充经验缓冲区;S2,生成温室模拟器用于模拟温室种植过程;S3,设计SAC算法批判者神经网络的数量,设计SAC算法行动者神经网络的目标函数,得到改进SAC算法;S4,利用所述改进SAC算法生成新的温室环境参数决策数据,将所述新的温室环境参数决策数据输入所述温室模拟器进行新的种植周期,数据放入经验缓冲区,利用经验缓冲区数据更新所述批判者神经网络的参数和行动者神经网络的参数;S5,重复执行步骤S4,直至完成若干种植周期,得到神经网络。
-
公开(公告)号:CN113050412A
公开(公告)日:2021-06-29
申请号:CN202110255704.3
申请日:2021-03-09
Applicant: 厦门大学
IPC: G05B13/02
Abstract: 本发明涉及一种基于迭代学习控制的批次反应釜控制方法的生成方法,所述迭代学习控制包含迭代学习控制算法和强化学习算法,所述方法包含以下步骤:S1,调试批次反应釜;S2,通过迭代学习控制算法对所述批次反应釜进行多批次的轨迹跟踪;采集所述批次反应釜的多批次数据并存入经验回放池中;S3,通过强化学习控制算法提取所述多批次数据,生成初始控制策略;S4,通过强化学习控制算法对所述批次反应釜实时轨迹跟踪;采集所述批次反应釜的实时数据并存入经验回放池中;S5,通过强化学习控制算法利用所述多批次数据和所述实时数据对所述初始控制策略进行多次更新优化,直到得到稳定控制策略。
-
-
-