一种基于强化学习的分布式训练任务的自适应调度方法
Abstract:
本发明公开了一种基于强化学习的分布式训练任务的自适应调度方法,包括如下步骤:S1、特征抽取;S2、模型分割;S3、设备部署;4.获取奖励函数;5.策略梯度更新;6.输出调度结果。该方法能够通过不断学习来得到一个最佳的模型划分和调度策略,从而加快在异构边缘设备上深度学习模型的流水线并行分布式训练。提出分组网络和部署网络的双神经网络结构,充分考虑到计算能力和通信延迟时间的差异,对深度学习模型进行模型分割和设备放置,得到调度方案,根据调度结果做流水线并行训练。将批量样本训练完成时间作为策略梯度的奖励函数,以此来更新双神经网络的参数。通过强化学习不断的探索与利用,最终能够得到最佳的调度方案来加速分布式训练。
Patent Agency Ranking
0/0