-
公开(公告)号:CN115034653B
公开(公告)日:2023-07-11
申请号:CN202210738071.6
申请日:2022-06-27
Applicant: 暨南大学
IPC: G06Q10/0631 , G06Q10/0633 , G06N3/126
Abstract: 本发明涉及用于人工智能技术领域,具体涉及一种基于transformer的端到端动态作业车间调度系统,可以应用于不同尺寸的DJSSP。由特征提取模块、特征压缩模块、动作选择模块所构成。特征提取模块提取生产环境特征,并利用特征压缩模块将生产环境的特征进一步压缩成定长向量。然后,动作选择模块根据压缩后的能够反映生产环境状态的定长向量,实时选择简单优先级规则。本发明所建立的系统是Transformer在DJSSP中的第一个应用,不仅提高了工业调度的生产能力,而且为未来深度学习在DJSSP中的研究提供了范式。
-
公开(公告)号:CN115034653A
公开(公告)日:2022-09-09
申请号:CN202210738071.6
申请日:2022-06-27
Applicant: 暨南大学
Abstract: 本发明涉及用于人工智能技术领域,具体涉及一种基于transformer的端到端动态作业车间调度模型,可以应用于不同尺寸的DJSSP(作业车间调度问题)。由特征提取模块、特征压缩模块、动作选择模块所构成。特征提取模块提取生产环境特征,并利用特征压缩模块将生产环境的特征进一步压缩成定长向量。然后,动作选择模块根据压缩后的能够反映生产环境状态的定长向量,实时选择简单优先级规则。本发明所建立的模型是Transformer在DJSSP中的第一个应用,不仅提高了工业调度的生产能力,而且为未来深度学习在DJSSP中的研究提供了范式。
-
公开(公告)号:CN113282787B
公开(公告)日:2022-01-04
申请号:CN202110567524.9
申请日:2021-05-24
Applicant: 暨南大学
IPC: G06F16/735 , G06K9/62 , G06N20/00
Abstract: 本发明提出一种基于强化学习的个性化短视频推荐方法以及系统,个性化短视频推荐方法包括:收集单个用户的历史记录,得到真实数据分布和专家轨迹;将真实数据分布输入GAN‑SD算法,对用户的特征进行建模,得到用户特征分布;将用户特征分布和专家轨迹输入到MAIL算法,对用户的交互行为建模,得到用户的决策函数;得到用户特征分布和决策函数后,完成对用户的建模;建模推荐引擎和用户的马尔科夫决策过程,用TRPO+ANC算法训练推荐引擎的马尔科夫决策过程,根据得到的累积回报值确定不同动作下的短视频推荐策略,从短视频推荐策略中选择最优的短视频推荐策略,将该策略加载为实际使用的推荐引擎。
-
公开(公告)号:CN113282787A
公开(公告)日:2021-08-20
申请号:CN202110567524.9
申请日:2021-05-24
Applicant: 暨南大学
IPC: G06F16/735 , G06K9/62 , G06N20/00
Abstract: 本发明提出一种基于强化学习的个性化短视频推荐方法以及系统,个性化短视频推荐方法包括:收集单个用户的历史记录,得到真实数据分布和专家轨迹;将真实数据分布输入GAN‑SD算法,对用户的特征进行建模,得到用户特征分布;将用户特征分布和专家轨迹输入到MAIL算法,对用户的交互行为建模,得到用户的决策函数;得到用户特征分布和决策函数后,完成对用户的建模;建模推荐引擎和用户的马尔科夫决策过程,用TRPO+ANC算法训练推荐引擎的马尔科夫决策过程,根据得到的累积回报值确定不同动作下的短视频推荐策略,从短视频推荐策略中选择最优的短视频推荐策略,将该策略加载为实际使用的推荐引擎。
-
-
-