基于多智能体强化学习的多用户抗干扰动态频谱接入控制方法

    公开(公告)号:CN116634575A

    公开(公告)日:2023-08-22

    申请号:CN202310629501.5

    申请日:2023-05-30

    Abstract: 本发明公开了一种基于多智能体强化学习的多用户抗干扰动态频谱接入控制方法,包括:各用户节点感知信道获取当前受到干扰的信道,作为状态信息;各用户节点分别依赖感知到的环境状态,依据自身演员网络做出决策,选择下一步发送通信数据的信道;各用户节点分别在选定的信道上进行接入,并发送数据,计算当前动作的回报;各用户节点将本时隙获得回报值上传至中心评论员网络;对评论员网络进行更新;评论员网络将损失函数值下发至各用户节点,各用户节点依据损失函数值独立更新自身演员网络参数。本发明不需要任何关于通信系统的先验信息,各节点在训练完成后,即可独立依据自身环境的感知实现抗干扰频谱接入。

Patent Agency Ranking