-
公开(公告)号:CN117634582A
公开(公告)日:2024-03-01
申请号:CN202311320472.0
申请日:2023-10-12
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
IPC: G06N3/092 , G06N3/084 , G06N3/096 , G06N3/0442 , G06N3/045 , G06N5/01 , G06F18/243 , G06N3/0464
Abstract: 本申请属于深度学习技术领域,特别涉及一种可解释类深度模型策略逼近算法。包括:步骤一、构建基于卷积神经网络的语义空间策略;步骤二、构建所述语义空间策略的决策树分类模型;步骤三、通过所述语义空间策略生成目标输出,训练所述决策树分类模型。本申请的可解释类深度模型策略逼近算法,建立了卷积神经网络中的可解释模型,在一定程度上,透明化了深度学习中端对端黑箱,并且将卷积神经网络内部过滤器的混沌特征转化为语义上有意义的概念。
-
公开(公告)号:CN113743583B
公开(公告)日:2024-02-02
申请号:CN202110904687.1
申请日:2021-08-07
Applicant: 中国航空工业集团公司沈阳飞机设计研究所 , 沈阳飞机设计研究所扬州协同创新研究院有限公司
IPC: G06N3/0499 , G06N3/092 , G05D1/24
Abstract: 本申请涉及机器学习技术领域,具体涉及一种基于强化学习的智能体无效行为切换抑制方法。该方法包括:步骤S1、在记忆库中采样一个batch的样本数据;步骤S2、更新强化学习模型的内层模型策略网络与价值网络;步骤S3、固定内层网络参数,更新外层模型策略网络与价值网络,其中,引入智能体无效行为切换算子,并在外层模型相对于内层模型执行无效行为时,降低其价值网络的奖励;步骤S4、以外层模型策略网络的强化学习策略作为智能体实时交互策略并采集数据,更新所述记忆库的交互数据;步骤S5、重复上述步骤,直至模型收敛。本申请在不引入额外人工标注的条件下有效降低智能体的频繁动作切换,不影响模型收敛性能,并提升强化学习模型的鲁棒性与实用性。
-
公开(公告)号:CN117350382A
公开(公告)日:2024-01-05
申请号:CN202311225191.7
申请日:2023-09-21
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
Abstract: 本申请提供了一种面向空中智能体博弈的策略多样性增强方法,所述方法包括:基于种群训练方法,构造空中智能体的二人零和博弈求解器;面向空中智能体的行为空间,以行为空间多样性最大化为目标,构建空中智能体种群;面向空中智能体的参数空间,基于参数敏感性度量,在实现种群风格多样性、防止空中智能体种群个体间过早趋同的同时,最大化种群多样性风格的利用效率,通过空中智能体代际更新记忆增强训练方法进行参数更新。本申请可有效克服了空中博弈智能体间相互克制的问题,针对空中智能体种群策略演化时出现的代际遗忘问题,基于终生学习思想,设计智能体策略记忆增强机制,实现高鲁棒性、高战斗力的空中博弈智能体。
-
公开(公告)号:CN115061371B
公开(公告)日:2023-08-04
申请号:CN202210701895.6
申请日:2022-06-20
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
IPC: G05B13/04
Abstract: 本申请提供了一种防止策略抖动的无人机控制策略强化学习生成方法,包括:初始化无人机控制策略网络及值网络;无人机控制策略在环境中的采样;采用GAE方法,根据样本估计优势函数;在优势函数上叠加防止无人机操控策略抖动的规范化项;更新无人机控制策略网络与值网络;重复上述步骤直至收敛,从而完成无人机控制策略的强化学习。本申请提供的方法基于行为者‑评论家强化学习方法架构,将当前状态下、当前执行动作情况下切换动作所带来的收益附加值作为评价动作切换的规范化项,用以抑制不必要的动作切换,实现不改变原有最优策略情况下,有效降低强化学习方法生成策略的抖动,使强化学习生成的策略更容易应用于真实环境中。
-
公开(公告)号:CN115097853B
公开(公告)日:2023-07-07
申请号:CN202210551472.0
申请日:2022-05-18
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
Abstract: 本申请属于无人机智能控制领域,为一种基于细粒度重复策略的无人机机动飞行控制方法,基于无人机气动力参数构建全量六自由度模型和飞行控制率模块,用于模拟飞行控制环境,而后通过建立马尔科夫决策过程来分析各个控制指令以及对应的奖惩函数,而后通过DDPG算法和细粒度策略网络的结合形成各个控制指令与时间相对应的集合,对无人机进行控制。与传统机动控制器相比较不需要精确的线性化控制建模,能够生成连续的机动控制指令,不存在控制器切换而产生的指令反复跳变等问题。与经典的深度强化学习算法相比,该方法生成的机动飞行控制指令更加平滑,减少飞行任务中的指令有害切换次数,进而能够加快深度强化学习算法的训练速度。
-
公开(公告)号:CN115268481B
公开(公告)日:2023-06-20
申请号:CN202210787640.6
申请日:2022-07-06
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
Abstract: 本申请属于非电变量的控制或调节系统领域,具体涉及一种无人机对抗策略决策方法及其系统,其中,无人机对抗策略决策方法,包括:对待决策无人机的对抗态势进行抽象,构建待决策无人机对抗态势抽象图;根据待决策无人机对抗态势抽象图,识别对待决策无人机最重要的无人机,构建待决策无人机对抗关系图;根据待决策无人机对抗关系图,进行待决策无人机的态势感知、信息交互,生成待决策无人机的对抗策略。
-
公开(公告)号:CN111125448B
公开(公告)日:2023-04-07
申请号:CN201911337772.3
申请日:2019-12-23
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
IPC: G06F16/901 , G06F16/903
Abstract: 本申请提供了一种大规模空中任务决策方法,所述方法包括:获取已知的空中任务决策知识体系;根据已知的空中任务决策知识体系构建空中任务决策的非全区域决策规则;根据所述非全区域决策规则生成全区域决策规则并填入哈希空间中;根据所述哈希空间中的全区域决策规则执行空中任务的决策。与现有技术相比,本申请以现有技术的人类知识为基础,将其解析成若干条不完全划分的决策规则,之后自动生成完全划分的排列组合决策规则并自动映射到哈希解空间,解决了决策系统的规则填写问题,为高维大规模的飞机空中任务决策提供了高效的解决方案。
-
公开(公告)号:CN111046497B
公开(公告)日:2023-04-07
申请号:CN201911348515.X
申请日:2019-12-24
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
Abstract: 本申请属于飞机总体设计领域,特别涉及一种高空高速飞机突防生存力快速评估装置,包括:导弹性能模型,用于导弹全空域弹道仿真,实时输出导弹飞行信息;飞机性能模型,用于真实模拟飞机气动特性和机动能力;仿真框架模块,用于对飞机性能模型和导弹性能模型进行调用;处理模块集群,受控于仿真框架模块,用于实现高空高速飞机突防生存力快速评估仿真并行计算;仿真剖面设置模块,提供相对应的参数的仿真范围和步长;仿真结果分析模块,用于对仿真结果数据进行分析。本申请的高空高速飞机突防生存力快速评估装置,能够实现高空高速飞机突防生存力的快速评估,加速飞机平台方案和突防方案的设计迭代,快速验证方案可行性,提高设计效率。
-
公开(公告)号:CN113743583A
公开(公告)日:2021-12-03
申请号:CN202110904687.1
申请日:2021-08-07
Applicant: 中国航空工业集团公司沈阳飞机设计研究所 , 沈阳飞机设计研究所扬州协同创新研究院有限公司
Abstract: 本申请涉及机器学习技术领域,具体涉及一种基于强化学习的智能体无效行为切换抑制方法。该方法包括:步骤S1、在记忆库中采样一个batch的样本数据;步骤S2、更新强化学习模型的内层模型策略网络与价值网络;步骤S3、固定内层网络参数,更新外层模型策略网络与价值网络,其中,引入智能体无效行为切换算子,并在外层模型相对于内层模型执行无效行为时,降低其价值网络的奖励;步骤S4、以外层模型策略网络的强化学习策略作为智能体实时交互策略并采集数据,更新所述记忆库的交互数据;步骤S5、重复上述步骤,直至模型收敛。本申请在不引入额外人工标注的条件下有效降低智能体的频繁动作切换,不影响模型收敛性能,并提升强化学习模型的鲁棒性与实用性。
-
公开(公告)号:CN109214516B
公开(公告)日:2021-09-03
申请号:CN201810806436.8
申请日:2018-07-20
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
IPC: G06N5/04
Abstract: 本发明涉及自主决策领域,特别涉及一种模糊推理系统的完备决策生成方法。包括步骤1:步骤1:将矩阵[Aij]n×m表示为二维度列表var_pool;步骤2:初始化一个可扩展的列表array:array=[[]];步骤3:生成模糊推理系统的完备决策矩阵,包括:步骤31:以动态扩展树的形式生成完备决策矩阵的规则前件;步骤32:填写完备决策矩阵的规则后件,将填好的完备决策矩阵的规则后件,生成为列向量与array合成模糊推理系统的完备决策矩阵。本发明的模糊推理系统的完备决策生成方法,能够快速生成包含所有推理结果的不相悖的完备规则集,并将规则库中所有规则进行有序的存储和排列,方便查验,能够极大程度的保证模糊推理系统规则的完备性,信息的全面性和推理的正确性。
-
-
-
-
-
-
-
-
-