一种基于深度强化学习的多无人机协同追踪方法

    公开(公告)号:CN116127848A

    公开(公告)日:2023-05-16

    申请号:CN202310169927.7

    申请日:2023-02-27

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于深度强化学习的多无人机协同追踪方法,属于多智能体控制领域。该方法首先在无人机对战仿真平台上对多无人机作战系统进行建模;随后,设置多无人机协同作战的固定规则动作以及多无人机的初始位置和追踪条件;接着,设置无人机智能体强化学习的状态、动作和奖励函数;最后,在面对不同对手的情况下,使用QMIX算法对无人机智能体进行训练,并根据训练效果调整超参数,实现无人机协同追踪的目的。

    基于Q-learning的多移动机器人编队方法

    公开(公告)号:CN114047758B

    公开(公告)日:2024-06-14

    申请号:CN202111314651.4

    申请日:2021-11-08

    Abstract: 本发明公开了一种基于Q‑learning的多移动机器人编队方法。首先利用博弈论对多移动机器人系统刚性编队问题建模,证明了所建立的博弈模型为序数势博弈模型,并且理论证明了纳什均衡点的存在性。随后,为了实现移动机器人自主决策进行编队,设计了基于Q‑learning的移动机器人博弈策略,通过求解博弈模型的纳什均衡点,实现多移动机器人系统的刚性编队。最后,利用Python实现了基于Q‑learning的博弈策略,通过一系列仿真实验,实现了三角形、四边形及梯形等多种形状的刚性编队,验证了所提出方法的有效性。

    基于固定时间分布式优化的智能电网经济调度方法

    公开(公告)号:CN115310776A

    公开(公告)日:2022-11-08

    申请号:CN202210845880.7

    申请日:2022-07-19

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于固定时间分布式优化的智能电网经济调度方法。该方法分为两个阶段,第一阶段使得每个发电机组在任意初始输出功率下都能在固定时间内收敛到预设值,实现供需平衡;第二阶段在满足供需平衡及满足最大输出功率限制的前提下使发电机组发电的总发电成本在固定时间内取得最小值。本发明采用完全分布式控制的方式调节每个发电机组的输出功率,有效节省了智能电网的计算资源成本和通信成本。本发明的收敛时间不受发电机组初始输出功率的影响,可以根据任务需求离线地预分配任务建立时间,在固定时间内解决了智能电网中的经济调度问题。

    基于动态角色目标分配的多智能体追逐方法

    公开(公告)号:CN116185033A

    公开(公告)日:2023-05-30

    申请号:CN202310170354.X

    申请日:2023-02-27

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于动态角色目标分配的多智能体追逐方法。在多智能体追逃任务中,确定追逃双方智能体在追逃场景中的运动方程及约束条件,基于Apollonius circle实现根据变化的环境动态的分配各追逐智能体的角色,将具备积极角色的追逐智能体映射到相应逃跑智能体的追逐团队,继而追逐智能体根据当前各智能体的位置状态决策加入哪个团队的追捕,在追逐过程中实时从目标团队中移除已被捕获的逃跑智能体,不断更新多智能体系统,直到捕获所有逃跑智能体。本发明可以极大程度上发挥各追逐智能体在集体追逐任务中的作用,不受限于逃跑智能体与追逐智能体的相对数量和逃跑智能体的策略,可以实现在有限时间内捕捉所有的逃跑智能体。

    追逃场景下对抗生成模仿学习的无人机围捕资源分配方法

    公开(公告)号:CN119514614A

    公开(公告)日:2025-02-25

    申请号:CN202411583205.7

    申请日:2024-11-07

    Abstract: 追逃场景下对抗生成模仿学习的无人机围捕资源分配方法,旨在确定多对多追逃场景下各个追捕者无人机的追击目标,从而解决围捕资源分配问题。该方法首先针对多对多追无人机逃场景建立系统模型并进行符号声明。随后引入阿波罗尼斯圆的概念,建立用于无人机围捕资源分配的势博弈模型。接着,提出了一种基于线性规划的最优围捕资源分配方案求解算法。最后,提出了一种基于对抗生成模仿学习的无人机围捕资源分配算法。本发明设计的算法,不受追逃双方无人机数量与初始状态的影响,可以采用线性规划算法寻找势博弈下的纳什均衡,并基于对抗生成模仿学习自适应学习最优围捕资源分配方案,最终实现多对多无人机追逃场景下围捕资源的实时动态分配调度。

    基于CAN总线的多步进电机矢量推进器系统及控制方法

    公开(公告)号:CN117434860A

    公开(公告)日:2024-01-23

    申请号:CN202311351210.0

    申请日:2023-10-18

    Applicant: 东南大学

    Abstract: 本发明涉及一种基于CAN总线的多步进电机矢量推进器系统及控制方法,属于矢量推进技术领域。该系统包括主控PCB系统和若干个由步进电机的驱动PCB与步进电机本身构成的闭环驱动系统,主控PCB系统与单个闭环驱动系统之间通过CAN总线连接;主控PCB系统负责每个闭环驱动系统的驱动、传感器对数据的读取以及CAN通信接收控制信息和传递角度信息;每个闭环驱动系统包含一块集成多个模块的驱动板和一台电机,驱动板包含电源模块、主控芯片模块、电机驱动模块、传感器模块、CAN通信模块、OLED显示模块以及电机扇叶模块。本发明实现了绝对角度、方向和复位控制,系统精确地执行角度控制指令,旋转指定的角度。

    基于规定时间纳什均衡寻找的无人机追逃博弈方法

    公开(公告)号:CN117369505A

    公开(公告)日:2024-01-09

    申请号:CN202311441521.6

    申请日:2023-11-01

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于规定时间纳什均衡(PTNE)寻找的无人机追逃博弈(PEG)方法,旨在解决追逐‑逃避游戏中的多个追逐者与逃避者之间的博弈问题。该方法首先建立追逐‑逃避游戏的无人机运动的二阶动力学方程,然后提出无人机的通信图,并设计追逐者的收益函数,再提出无人机追逃博弈的纳什均衡定义以及引理条件,设计在规定时间内实现达到追逃博弈纳什均衡的收敛算法并给出算法收敛的前提条件;最后证明收敛算法的收敛性。本发明设计的分布式算法,通过自适应调整控制方案参数,可以在PTNE下实现PEG。

Patent Agency Ranking