-
公开(公告)号:CN117354227A
公开(公告)日:2024-01-05
申请号:CN202311244592.7
申请日:2023-09-25
Applicant: 北京邮电大学
Abstract: 本申请提供一种基于强化学习智能体探索优化的跨层路由方法及相关设备,包括:确定当前时刻目标跨层网络结构的网络状态和业务请求,将网络状态和所述业务请求输入到强化学习智能体,通过强化学习智能体中的动态图注意力网络对强化学习智能体的外部环境进行探索,得到目标动作;根据目标动作更新辅助图模型的边权重,执行路由和波长分配策略并更新网络环境;根据边权重更新强化学习智能体的内部环境,通过好奇心算法对强化学习智能体的内部环境进行探索,确定与内部环境相应的内在奖励;获取强化学习智能体外界环境的外在奖励,根据内在奖励及外在奖励更新强化学习智能体的参数;根据更新参数后的强化学习智能体,优化路由和波长分配策略。