一种面向空中智能体博弈的策略多样性增强方法

    公开(公告)号:CN117350382A

    公开(公告)日:2024-01-05

    申请号:CN202311225191.7

    申请日:2023-09-21

    Abstract: 本申请提供了一种面向空中智能体博弈的策略多样性增强方法,所述方法包括:基于种群训练方法,构造空中智能体的二人零和博弈求解器;面向空中智能体的行为空间,以行为空间多样性最大化为目标,构建空中智能体种群;面向空中智能体的参数空间,基于参数敏感性度量,在实现种群风格多样性、防止空中智能体种群个体间过早趋同的同时,最大化种群多样性风格的利用效率,通过空中智能体代际更新记忆增强训练方法进行参数更新。本申请可有效克服了空中博弈智能体间相互克制的问题,针对空中智能体种群策略演化时出现的代际遗忘问题,基于终生学习思想,设计智能体策略记忆增强机制,实现高鲁棒性、高战斗力的空中博弈智能体。

    一种防止策略抖动的无人机控制策略强化学习生成方法

    公开(公告)号:CN115061371B

    公开(公告)日:2023-08-04

    申请号:CN202210701895.6

    申请日:2022-06-20

    Abstract: 本申请提供了一种防止策略抖动的无人机控制策略强化学习生成方法,包括:初始化无人机控制策略网络及值网络;无人机控制策略在环境中的采样;采用GAE方法,根据样本估计优势函数;在优势函数上叠加防止无人机操控策略抖动的规范化项;更新无人机控制策略网络与值网络;重复上述步骤直至收敛,从而完成无人机控制策略的强化学习。本申请提供的方法基于行为者‑评论家强化学习方法架构,将当前状态下、当前执行动作情况下切换动作所带来的收益附加值作为评价动作切换的规范化项,用以抑制不必要的动作切换,实现不改变原有最优策略情况下,有效降低强化学习方法生成策略的抖动,使强化学习生成的策略更容易应用于真实环境中。

    一种基于细粒度重复策略的无人机机动飞行控制方法

    公开(公告)号:CN115097853B

    公开(公告)日:2023-07-07

    申请号:CN202210551472.0

    申请日:2022-05-18

    Abstract: 本申请属于无人机智能控制领域,为一种基于细粒度重复策略的无人机机动飞行控制方法,基于无人机气动力参数构建全量六自由度模型和飞行控制率模块,用于模拟飞行控制环境,而后通过建立马尔科夫决策过程来分析各个控制指令以及对应的奖惩函数,而后通过DDPG算法和细粒度策略网络的结合形成各个控制指令与时间相对应的集合,对无人机进行控制。与传统机动控制器相比较不需要精确的线性化控制建模,能够生成连续的机动控制指令,不存在控制器切换而产生的指令反复跳变等问题。与经典的深度强化学习算法相比,该方法生成的机动飞行控制指令更加平滑,减少飞行任务中的指令有害切换次数,进而能够加快深度强化学习算法的训练速度。

    一种高空高速飞机突防生存力快速评估装置

    公开(公告)号:CN111046497B

    公开(公告)日:2023-04-07

    申请号:CN201911348515.X

    申请日:2019-12-24

    Abstract: 本申请属于飞机总体设计领域,特别涉及一种高空高速飞机突防生存力快速评估装置,包括:导弹性能模型,用于导弹全空域弹道仿真,实时输出导弹飞行信息;飞机性能模型,用于真实模拟飞机气动特性和机动能力;仿真框架模块,用于对飞机性能模型和导弹性能模型进行调用;处理模块集群,受控于仿真框架模块,用于实现高空高速飞机突防生存力快速评估仿真并行计算;仿真剖面设置模块,提供相对应的参数的仿真范围和步长;仿真结果分析模块,用于对仿真结果数据进行分析。本申请的高空高速飞机突防生存力快速评估装置,能够实现高空高速飞机突防生存力的快速评估,加速飞机平台方案和突防方案的设计迭代,快速验证方案可行性,提高设计效率。

    一种模糊推理系统的完备决策生成方法

    公开(公告)号:CN109214516B

    公开(公告)日:2021-09-03

    申请号:CN201810806436.8

    申请日:2018-07-20

    Abstract: 本发明涉及自主决策领域,特别涉及一种模糊推理系统的完备决策生成方法。包括步骤1:步骤1:将矩阵[Aij]n×m表示为二维度列表var_pool;步骤2:初始化一个可扩展的列表array:array=[[]];步骤3:生成模糊推理系统的完备决策矩阵,包括:步骤31:以动态扩展树的形式生成完备决策矩阵的规则前件;步骤32:填写完备决策矩阵的规则后件,将填好的完备决策矩阵的规则后件,生成为列向量与array合成模糊推理系统的完备决策矩阵。本发明的模糊推理系统的完备决策生成方法,能够快速生成包含所有推理结果的不相悖的完备规则集,并将规则库中所有规则进行有序的存储和排列,方便查验,能够极大程度的保证模糊推理系统规则的完备性,信息的全面性和推理的正确性。

Patent Agency Ranking