一种基于混合学习方法的再入飞行器编队控制方法、系统及存储介质

    公开(公告)号:CN119847199A

    公开(公告)日:2025-04-18

    申请号:CN202411957434.0

    申请日:2024-12-30

    Abstract: 本发明一种基于混合学习方法的再入飞行器编队控制方法、系统及存储介,涉及再入飞行器控制技术领域,为解决现有的基于强化学习的控制方法难以探索性能边界、控制方法不能确保安全的问题。包括:步骤一:获取单个飞行器的飞行轨迹数据;步骤二:以飞行器作为智能体,建立智能体决策网络,通过监督学习的方式进行训练得到智能体自主控制模型;步骤三:基于深度强化学习理论建立多智能体协同控制网络,将智能体自主控制模型应用到多智能体协同控制网络中,采用包括飞行器单体奖励与群体奖励的耦合奖励机制,对智能体自主控制模型进行协同控制训练,得到多智能体协同控制模型;步骤四:通过多智能体协同控制模型对再入飞行器编队进行协同控制。

    一种基于数据驱动的无人系统集群通信频率自适应调整方法、系统及存储介质

    公开(公告)号:CN119835769A

    公开(公告)日:2025-04-15

    申请号:CN202411957388.4

    申请日:2024-12-30

    Abstract: 本发明一种基于数据驱动的无人系统集群通信频率自适应调整方法、系统及存储介质,涉及无人系统集群领域,为解决现有方法将通信频率的选择作为默认的固定值或将通信频率的限制作为前提,不能自适应地对通信频率进行调节的问题。包括:步骤一、获取无人机集群在不同飞行速度与通信频率下飞行状态数据;步骤二、基于无人机集群中各无人机在转弯段飞行状态数据的偏差定义集群飞行状态的评价指标;步骤三、计算集群飞行指标并进行降维处理;步骤四、将不同频率与集群飞行指标进行典型函数拟合,确定二者的定量关系;步骤五、确定不同飞行速度下的通信频率与集群飞行指标之间的定量函数关系,反解函数关系得到特定要求与条件下的最佳通信频率。

    一种基于零反作用空间和强化学习的空间漂浮机械臂运动规划方法及系统

    公开(公告)号:CN119610122A

    公开(公告)日:2025-03-14

    申请号:CN202411968570.X

    申请日:2024-12-30

    Abstract: 一种基于零反作用空间和强化学习的空间漂浮机械臂运动规划方法及系统,涉及机械臂运动规划领域。本发明为是为了克服现有空间漂浮机械臂运动导致的基座姿态扰动的问题而提出来的。技术要点:本发明通过将空间机械臂的运动空间设计为零反作用空间,确保机械臂的运动不会对基座产生不希望的扰动,从而提高系统的稳定性和任务执行精度。此外,本文结合了强化学习算法,将其动作空间设定为零反作用运动空间。强化学习的高效搜索和优化能力使得机械臂能够在复杂任务空间中找到最优运动策略,同时有效避免了对基座的扰动。通过多轮训练,强化学习能够不断调整策略,以适应不同的任务需求,保证机械臂在执行空间抓取、维修等任务时,既能保持高精度操作,又能确保基座稳定。实验结果表明,该方法能够显著减少基座姿态的偏移,提高了任务执行的稳定性和效率,为未来空间机械臂在轨服务任务提供了一种可行的解决方案。

    一种用于机械臂强化学习运动规划中启发式奖励函数的设计方法

    公开(公告)号:CN113894787A

    公开(公告)日:2022-01-07

    申请号:CN202111278998.8

    申请日:2021-10-31

    Abstract: 一种用于机械臂强化学习运动规划中启发式奖励函数的设计方法,本发明涉及机器人运动规划与智能控制技术领域。本发明为了解决基于强化学习的机械臂运动规划算法的奖励函数设计无统一的指导方法通常依靠经验进行设计的问题。本发明包括:建立机械臂运动规划问题的启发式函数;根据启发式函数,构建机械臂运动规划的启发式奖励函数;确定启发式奖励函数中的参数取值;利用构建的启发式奖励函数训练机械臂运动规划的神经网络运动规划器。启发式奖励函数明显提升了运动规划的成功率并加快了收敛速度。本发明用于机械臂的运动规划与智能控制领域。

    一种基于改进A-star算法与强化学习的集群路径规划方法及系统

    公开(公告)号:CN119902432A

    公开(公告)日:2025-04-29

    申请号:CN202411951191.X

    申请日:2024-12-27

    Abstract: 本发明提供一种基于改进A‑star算法与强化学习的集群路径规划方法及系统,属于无人机集群控制领域。为解决现有传统路径规划中未考虑集群体积导致其碰撞和在高动态环境下失效问题。本发明基于改进的A*路径规划算法进行路径规划,考虑约束条件生成最优路径;通过局部目标点的设定,引导高速飞行器沿最短路径飞行;结合SAC强化学习算法,构建奖励函数以引导高速飞行器向目标飞行;根据高速飞行器的约束条件设计目标飞行奖励;采用基于改进A‑star与深度强化学习的分层控制框架,进一步优化集群飞行路径和避障能力。本发明在复杂障碍环境中确保集群的精确路径规划与稳定编队控制,有效提升了无人机集群在复杂环境中的避障能力和协同控制。

    一种基于滑模控制的高速飞行器时间协同制导方法及系统

    公开(公告)号:CN119847176A

    公开(公告)日:2025-04-18

    申请号:CN202411953656.5

    申请日:2024-12-27

    Abstract: 本发明提供一种基于滑模控制的高速飞行器时间协同制导方法及系统,属于飞行器制导与控制领域。为解决现有制导方法计算量大、实时性不足及协同精度较差的问题。本发明通过集中式协同策略快速预测多飞行器的剩余飞行时间,利用“谁慢跟随谁”的原则调整飞行器的时间偏差;基于滑模控制设计底层时间可控制导律,引入饱和函数改进抖振现象并解决奇点问题;通过三维偏置比例导引律实现飞行器横向轨迹弯曲以调整飞行时间;利用变步长数值积分法提高剩余飞行时间计算的精度与效率;在滑翔段末端完成多飞行器的编队变换以支持末制导任务。本发明在降低计算复杂度的同时,显著提高了时间协同的精度和鲁棒性,为多飞行器协同制导任务提供了可靠的技术支持。

    一种基于安全强化学习的高速飞行器集群协同方法及系统

    公开(公告)号:CN119828727A

    公开(公告)日:2025-04-15

    申请号:CN202411951184.X

    申请日:2024-12-27

    Abstract: 本发明提供一种基于安全强化学习的高速飞行器集群协同方法及系统,属于飞行器集群协同领域。为解决现有强化学习算法应用于高速飞行器集群协同任务中不可解释性导致的安全性问题。本发明将安全强化学习理论引入飞行器集群智能决策问题,基于李雅普诺夫稳定性理论提出了改进软演员‑评论家算法,建立以法向过载为控制量的动力学模型,将任务划分为目标打击、编队保持和威胁区规避,设计飞行器引导奖励函数,通过与演员‑评论家算法对比,得出该方法能够使智能体在整个训练过程中保持较低的安全成本的结论。本发明可实现部分安全性可解释的高速飞行器集群协同智能策略的获得,从而有效地避免因奖励函数设计不当引起威胁区规避任务失败的情况。

Patent Agency Ranking