一种无人机时空众包的资源分配方法及装置
Abstract:
本发明涉及通信技术领域,特别涉及一种无人机时空众包的资源分配方法及装置。方法包括:将无人机和IoT设备的三维服务区映射到二维,获得二维服务区的坐标范围和时间数据集合;基于无人机的时间数据集合收集每个时间段内的IoT数据;预设无人机禁飞区,计算无人机的边界约束和禁飞区约束;预设多个优化目标进行加权平衡;将优化问题表述为马尔科夫决策过程;采用双延迟深度确定性策略梯度法,对无人机的飞行动作和IoT的功率进行分配。本发明部署了一种先进的强化学习算法,即TD3。它利用深度神经网络基于演员‑评论家架构来逼近策略和价值函数,因此它在高性能和低时间复杂性方面表现出色,且验证了所提出的算法的有效性。
Public/Granted literature
Patent Agency Ranking
0/0