基于强化学习和注意力机制的智能作业调度系统

    公开(公告)号:CN114580937B

    公开(公告)日:2023-04-28

    申请号:CN202210237299.7

    申请日:2022-03-10

    Applicant: 暨南大学

    Abstract: 本发明涉及用于数据处理方法技术领域,具体涉及一种基于强化学习和注意力机制的智能作业调度系统;包括:从给定的由机器矩阵MO和工时矩阵TO描述的调度实例,生成包含动态事件的由新的机器矩阵MO′和新的工时矩阵TO′描述的调度实例,并将其作为当前交互环境;调度系统与环境进行交互,收集经验并训练;提取特征,输入D3QPN得到当前状态下不同动作的Q值;根据Q值表进行作业调度。本发明通过注意力机制有效提取出关键信息,并使用强化学习算法选择最优的调度策略解决动态作业车间问题,以此解决实际智能制造中作业的动态变化问题,让智能调度作业系统在动态作业调度环境下依然拥有不错的性能。

    基于熵优化安全强化学习的特种设备流程控制方法及系统

    公开(公告)号:CN114218867A

    公开(公告)日:2022-03-22

    申请号:CN202111563799.1

    申请日:2021-12-20

    Applicant: 暨南大学

    Abstract: 本发明提供了一种基于熵优化安全强化学习的特种设备流程控制方法及系统,属于人工智能技术领域。本发明根据特种设备生产的特点和实现的功能建立特种设备模型;提取生产线所需优化的参数,并定义符合特种设备生产特点的状态、动作、奖励函数、折扣因子、成本函数和策略模型,构建安全强化学习模型训练系统,采用马尔科夫决策过程进行训练;采用泛化优势估计算法实现基于Actor‑critic框架的熵优化安全强化学习算法,对马尔科夫决策过程中的每个策略设置上下边界,对特种设备进行流程控制。本发明采用的熵优化安全强化学习算法的流程控制,使得所构建的模型具有更好的泛化性,能够有效提高操作安全性、精准性。

    基于熵优化安全强化学习的特种设备流程控制方法及系统

    公开(公告)号:CN114218867B

    公开(公告)日:2022-06-28

    申请号:CN202111563799.1

    申请日:2021-12-20

    Applicant: 暨南大学

    Abstract: 本发明提供了一种基于熵优化安全强化学习的特种设备流程控制方法及系统,属于人工智能技术领域。本发明根据特种设备生产的特点和实现的功能建立特种设备模型;提取生产线所需优化的参数,并定义符合特种设备生产特点的状态、动作、奖励函数、折扣因子、成本函数和策略模型,构建安全强化学习模型训练系统,采用马尔科夫决策过程进行训练;采用泛化优势估计算法实现基于Actor‑critic框架的熵优化安全强化学习算法,对马尔科夫决策过程中的每个策略设置上下边界,对特种设备进行流程控制。本发明采用的熵优化安全强化学习算法的流程控制,使得所构建的模型具有更好的泛化性,能够有效提高操作安全性、精准性。

    基于强化学习和注意力机制的智能作业调度系统

    公开(公告)号:CN114580937A

    公开(公告)日:2022-06-03

    申请号:CN202210237299.7

    申请日:2022-03-10

    Applicant: 暨南大学

    Abstract: 本发明涉及用于数据处理方法技术领域,具体涉及一种基于强化学习和注意力机制的智能作业调度系统;包括:从给定的由机器矩阵MO和工时矩阵TO描述的调度实例,生成包含动态事件的由新的机器矩阵MO′和新的工时矩阵TO′描述的调度实例,并将其作为当前交互环境;调度系统与环境进行交互,收集经验并训练;提取特征,输入D3QPN得到当前状态下不同动作的Q值;根据Q值表进行作业调度。本发明通过注意力机制有效提取出关键信息,并使用强化学习算法选择最优的调度策略解决动态作业车间问题,以此解决实际智能制造中作业的动态变化问题,让智能调度作业系统在动态作业调度环境下依然拥有不错的性能。

Patent Agency Ranking