-
公开(公告)号:CN117151425B
公开(公告)日:2024-04-26
申请号:CN202311364387.4
申请日:2023-10-20
Applicant: 暨南大学
IPC: G06Q10/0631 , G06N20/00 , G06Q10/30 , G06Q50/04 , G06Q50/26
Abstract: 本发明提供一种基于RQL算法的选择拆卸规划方法及系统,获取待拆卸产品的数据集,结合Q‑learning算法和Rollout策略迭代采样待拆卸产品的数据集,得到待拆卸产品的优选拆卸序列,本申请的RQL(Rollout‑Q‑learning)算法是基于Rollout策略优化了Q‑learning算法在迭代过程中的动作选择,在每个决策阶段使用Rollout策略对每个可行动作进行有限步数的模拟采样之后,选择在有限步数内估计价值最大的可行动作,从而使Q‑learning算法具备更强的全局搜索能力,最终得到优选拆卸序列,相对于传统的Q‑learning算法,RQL(Rollout‑Q‑learning)算法在拆卸序列规划上有很大的性能提升,同时能够提高拆卸流程的回收效益,尽可能减少EoL产品对环境造成的危害。
-
公开(公告)号:CN117151425A
公开(公告)日:2023-12-01
申请号:CN202311364387.4
申请日:2023-10-20
Applicant: 暨南大学
IPC: G06Q10/0631 , G06N20/00 , G06Q10/30 , G06Q50/04 , G06Q50/26
Abstract: 本发明提供一种基于RQL算法的选择拆卸规划方法及系统,获取待拆卸产品的数据集,结合Q‑learning算法和Rollout策略迭代采样待拆卸产品的数据集,得到待拆卸产品的优选拆卸序列,本申请的RQL(Rollout‑Q‑learning)算法是基于Rollout策略优化了Q‑learning算法在迭代过程中的动作选择,在每个决策阶段使用Rollout策略对每个可行动作进行有限步数的模拟采样之后,选择在有限步数内估计价值最大的可行动作,从而使Q‑learning算法具备更强的全局搜索能力,最终得到优选拆卸序列,相对于传统的Q‑learning算法,RQL(Rollout‑Q‑learning)算法在拆卸序列规划上有很大的性能提升,同时能够提高拆卸流程的回收效益,尽可能减少EoL产品对环境造成的危害。
-