基于深度强化学习的土方施工动态调度方法、设备和存储介质

    公开(公告)号:CN119624047A

    公开(公告)日:2025-03-14

    申请号:CN202510148941.8

    申请日:2025-02-11

    Abstract: 本发明提供了一种基于深度强化学习的土方施工动态调度方法、设备和存储介质,方法包括:获取施工信息,确定约束条件和施工设备的集成调度目标,设定目标函数;将施工设备的集成调度问题表述为马尔科夫动态决策过程,生成第一智能体;基于NSGA‑Ⅱ和DDQN算法设计奖励函数对第一智能体进行训练;生成初始调度方案,并基于该方案执行虚拟调度;基于假设的扰动事件补充约束条件,通过马尔科夫动态决策过程生成第二智能体;对初始调度方案中的作业进行区分,根据区分结果设计NSGA‑Ⅱ算法的编码和解码方法;基于设计编解码后的NSGA‑Ⅱ算法和DDQN算法设计奖励函数对第二智能体进行训练;将训练稳定后的智能体部署在实际施工环境中,生成动态调度决策。

Patent Agency Ranking