-
公开(公告)号:CN113918451B
公开(公告)日:2025-01-21
申请号:CN202111062056.6
申请日:2021-09-10
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
IPC: G06F11/3668
Abstract: 本申请涉及航空机器学习领域,为一种免模型强化学习的软件测试方法,包括根据要测试的功能集,构建测试条件集C,构建被测软件的观测空间O,构建测试动作空间A,形成测试模拟环境;构建对动作序列执行效果进行奖赏的奖赏函数;构建能够作用于软件本身的动作执行驱动接口;构建能够自我学习的测试策略网络;构建免模型的强化学习损失函数;驱动测试策略网络实时生成软件操作动作并通过动作执行驱动接口作用于软件,进行计算并记录数据元组,存入数据集;所述强化学习损失函数利用数据集优化测试策略网络参数。具有测试效率高、测试时间短、准确性高的技术效果。
-
公开(公告)号:CN117371488A
公开(公告)日:2024-01-09
申请号:CN202311324879.0
申请日:2023-10-12
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
IPC: G06N3/0455 , G06N3/0475 , G06N3/092 , G06N3/094 , G06N3/084
Abstract: 本申请属于数据生成技术领域,特别涉及一种用于多智能体智能策略的干预性数据生成方法。包括:步骤一、将干预性数据样本输入到变分自动编码器中进行编码;步骤二、将所述变分自动编码器输出的编码数据输入到生成式对抗网络的生成器中生成重构数据;将随机噪声数据输入到生成式对抗网络的生成器中生成虚拟数据;步骤三、将所述重构数据、所述虚拟数据以及所述干预性数据样本输入到生成式对抗网络的判别器中,训练生成式对抗网络;步骤四、将干预性数据样本输入到训练好的生成式对抗网络的生成器中生成干预性数据。本申请能够在已有的干预性数据样本的基础上获取更多的干预性数据,以此来扩充数据集。
-
公开(公告)号:CN117332842A
公开(公告)日:2024-01-02
申请号:CN202311320476.9
申请日:2023-10-12
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
Abstract: 本申请属于人工智能深度强化学习技术领域,特别涉及一种基于决策树的决策模型可解释方法。包括:步骤一、获取预训练好的策略模型;步骤二、通过所述策略模型与仿真软件进行交互,获取原始数据,所述原始数据包括场景态势数据和已方决策数据;步骤三、构建原始环境模型,并通过原始数据对所述原始环境模型进行有监督训练;步骤四、根据所述原始环境模型进行未来决策推演;步骤五、构建决策树模型,并将所述原始环境模型的输出作为决策树模型的输入,进行未来决策预测。本申请可以在离线时获得足够好的性能,以避免由于数据聚合而导致的模型失真。
-
公开(公告)号:CN117332841A
公开(公告)日:2024-01-02
申请号:CN202311320471.6
申请日:2023-10-12
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
IPC: G06N3/092 , G06N3/0499 , G06N5/01 , G06F18/243
Abstract: 本申请属于深度学习及强化学习领域,特别涉及一种基于深度学习及强化学习的语义空间算法。包括:步骤一、通过目标环境训练语义空间策略,所述语义空间策略基于深度学习及强化学习的Double DQN算法实现,并根据训练完成的所述语义空间策略训练解释模型;步骤二、通过与目标环境的交互使得所述解释模型的策略逼近所述语义空间策略。本申请的基于深度学习及强化学习的语义空间算法,能够使得神经网络具有清晰的符号化的内部知识表达,能够去匹配人类自身的知识框架,从而可以在语义层面对神经网络进行诊断和修改。
-
公开(公告)号:CN117332691A
公开(公告)日:2024-01-02
申请号:CN202311320478.8
申请日:2023-10-12
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
Abstract: 本申请属于人工智能深度学习技术领域,特别涉及一种基于环境模拟的决策行为预测方法。包括:步骤一、构建策略池,所述策略池中包括多个策略模型;步骤二、通过所述策略模型与仿真软件进行交互获取原始数据,所述原始数据包括场景态势数据以及已方决策数据;步骤三、构建原始环境模型,并基于所述原始数据对所述原始环境模型进行有监督训练;步骤四、训练门结构神经网络参数,并将所述门结构神经网络嵌入所述原始环境模型中,得到联合环境模型;步骤五、根据所述策略模型以及所述联合环境模型进行决策行为预测。本申请对于不同的空中环境和空中博弈条件下,能够快速自主学习新环境,有更好的泛化能力,对多种不同的场景态势有更好的演出结果。
-
公开(公告)号:CN110989649A
公开(公告)日:2020-04-10
申请号:CN201911364796.8
申请日:2019-12-26
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
Abstract: 本申请属于无人机飞行器控制技术领域,特别涉及一种面向高机动固定翼无人机的飞行动作控制装置及训练方法;控制装置包括:上层控制器,用于宏观无人机飞行动作选择;下层控制器,用于对上层选择的飞行动作进行相对精细的连续引导指令优化;控制装置的训练方法包括如下步骤:对上层控制器和下层控制器进行双层神经网络控制;对所述上层控制器和下层控制器进行双层神经网络训练。本申请的面向高机动固定翼无人机的飞行动作控制装置及训练方法,通过上下两层指令协调控制,避免了只控制飞行轨迹产生的较大的指令滞后;另外,通过分层强化学习方法,避免人为设计只能覆盖数个设计点导致的局限性,且能够适应场景发生变化,实现控制器自学习和自演化。
-
公开(公告)号:CN117634582A
公开(公告)日:2024-03-01
申请号:CN202311320472.0
申请日:2023-10-12
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
IPC: G06N3/092 , G06N3/084 , G06N3/096 , G06N3/0442 , G06N3/045 , G06N5/01 , G06F18/243 , G06N3/0464
Abstract: 本申请属于深度学习技术领域,特别涉及一种可解释类深度模型策略逼近算法。包括:步骤一、构建基于卷积神经网络的语义空间策略;步骤二、构建所述语义空间策略的决策树分类模型;步骤三、通过所述语义空间策略生成目标输出,训练所述决策树分类模型。本申请的可解释类深度模型策略逼近算法,建立了卷积神经网络中的可解释模型,在一定程度上,透明化了深度学习中端对端黑箱,并且将卷积神经网络内部过滤器的混沌特征转化为语义上有意义的概念。
-
公开(公告)号:CN116245388A
公开(公告)日:2023-06-09
申请号:CN202211532158.4
申请日:2022-12-01
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
IPC: G06Q10/0639 , G06Q10/0637 , G06N5/04 , G06F16/2458 , G06F16/26
Abstract: 本申请属于航空信息处理技术领域,特别涉及一种面向对抗博弈的智能策略评价方法。该方法包括步骤S1、基于采集的各个智能策略之间的对抗结果,计算各个智能策略之间的相互胜率;步骤S2、在各个智能策略之间的每一次对抗结束后,基于Elo算法计算各个智能策略的博弈积分;步骤S3、基于移动平均方法计算各个智能策略的随时间变化的多个平均博弈积分;步骤S4、基于各个智能策略之间的对抗过程的态势数据,采用多个综合评价指标进行数据统计;步骤S5、采用可视化方式对胜率、博弈积分、平均博弈积分及数据统计结果进行展示。本申请能够对对抗智能策略的优劣势进行科学定量的分析,为智能策略的改进提供数据支撑。
-
公开(公告)号:CN111125448B
公开(公告)日:2023-04-07
申请号:CN201911337772.3
申请日:2019-12-23
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
IPC: G06F16/901 , G06F16/903
Abstract: 本申请提供了一种大规模空中任务决策方法,所述方法包括:获取已知的空中任务决策知识体系;根据已知的空中任务决策知识体系构建空中任务决策的非全区域决策规则;根据所述非全区域决策规则生成全区域决策规则并填入哈希空间中;根据所述哈希空间中的全区域决策规则执行空中任务的决策。与现有技术相比,本申请以现有技术的人类知识为基础,将其解析成若干条不完全划分的决策规则,之后自动生成完全划分的排列组合决策规则并自动映射到哈希解空间,解决了决策系统的规则填写问题,为高维大规模的飞机空中任务决策提供了高效的解决方案。
-
公开(公告)号:CN119150947A
公开(公告)日:2024-12-17
申请号:CN202411175720.1
申请日:2024-08-26
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
IPC: G06N3/092
Abstract: 本申请属于飞机智能辅助控制设计技术领域,具体涉及一种飞机控制辅助提示神经网络策略模型平滑性调整方法,包括:训练得到辅助提示神经网络策略模型;对辅助提示神经网络策略模型进行重训练;对辅助提示神经网络策略模型进行重训练时,对辅助提示神经网络策略模型每一局输出辅助提示策略的基本机动动作进行计数,进而计算得到基于基本机动动作计数的内部激励,该内部激励增加到原有的内部激励中,对辅助提示神经网络策略模型进行深度强化学习训练。
-
-
-
-
-
-
-
-
-