-
公开(公告)号:CN117371488A
公开(公告)日:2024-01-09
申请号:CN202311324879.0
申请日:2023-10-12
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
IPC: G06N3/0455 , G06N3/0475 , G06N3/092 , G06N3/094 , G06N3/084
Abstract: 本申请属于数据生成技术领域,特别涉及一种用于多智能体智能策略的干预性数据生成方法。包括:步骤一、将干预性数据样本输入到变分自动编码器中进行编码;步骤二、将所述变分自动编码器输出的编码数据输入到生成式对抗网络的生成器中生成重构数据;将随机噪声数据输入到生成式对抗网络的生成器中生成虚拟数据;步骤三、将所述重构数据、所述虚拟数据以及所述干预性数据样本输入到生成式对抗网络的判别器中,训练生成式对抗网络;步骤四、将干预性数据样本输入到训练好的生成式对抗网络的生成器中生成干预性数据。本申请能够在已有的干预性数据样本的基础上获取更多的干预性数据,以此来扩充数据集。
-
公开(公告)号:CN117332842A
公开(公告)日:2024-01-02
申请号:CN202311320476.9
申请日:2023-10-12
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
Abstract: 本申请属于人工智能深度强化学习技术领域,特别涉及一种基于决策树的决策模型可解释方法。包括:步骤一、获取预训练好的策略模型;步骤二、通过所述策略模型与仿真软件进行交互,获取原始数据,所述原始数据包括场景态势数据和已方决策数据;步骤三、构建原始环境模型,并通过原始数据对所述原始环境模型进行有监督训练;步骤四、根据所述原始环境模型进行未来决策推演;步骤五、构建决策树模型,并将所述原始环境模型的输出作为决策树模型的输入,进行未来决策预测。本申请可以在离线时获得足够好的性能,以避免由于数据聚合而导致的模型失真。
-
公开(公告)号:CN116561702A
公开(公告)日:2023-08-08
申请号:CN202310528787.8
申请日:2023-05-11
Applicant: 吉林大学 , 中国航空工业集团公司沈阳飞机设计研究所
IPC: G06F18/25 , G06F18/214 , G06F18/243 , G06F18/23213 , G06N5/01 , G06N20/00
Abstract: 本发明公开了一种面向开放环境的人机协作意图理解方法、系统及设备。该方法包括:定义任务需求的意图集合;获取设备运行的历史多维时间序列数据;对所述历史多维时间序列数据进行特征融合,构建训练集;以所述训练集为输入,以所述训练集对应的所述意图集合中的意图分布概率为输出,对神经网络模型进行训练;构建基于决策树的产生式规则模型;将当前时刻的多维时间序列数据进行特征融合后与上一时刻的意图进行数据拼接;基于拼接后的数据,通过训练好的神经网络模型和所述产生式规则模型识别设备当前时刻的意图。本发明能够解决现有技术中意图识别的准确率低,且模型复杂的问题。
-
公开(公告)号:CN110989649A
公开(公告)日:2020-04-10
申请号:CN201911364796.8
申请日:2019-12-26
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
Abstract: 本申请属于无人机飞行器控制技术领域,特别涉及一种面向高机动固定翼无人机的飞行动作控制装置及训练方法;控制装置包括:上层控制器,用于宏观无人机飞行动作选择;下层控制器,用于对上层选择的飞行动作进行相对精细的连续引导指令优化;控制装置的训练方法包括如下步骤:对上层控制器和下层控制器进行双层神经网络控制;对所述上层控制器和下层控制器进行双层神经网络训练。本申请的面向高机动固定翼无人机的飞行动作控制装置及训练方法,通过上下两层指令协调控制,避免了只控制飞行轨迹产生的较大的指令滞后;另外,通过分层强化学习方法,避免人为设计只能覆盖数个设计点导致的局限性,且能够适应场景发生变化,实现控制器自学习和自演化。
-
公开(公告)号:CN117634582A
公开(公告)日:2024-03-01
申请号:CN202311320472.0
申请日:2023-10-12
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
IPC: G06N3/092 , G06N3/084 , G06N3/096 , G06N3/0442 , G06N3/045 , G06N5/01 , G06F18/243 , G06N3/0464
Abstract: 本申请属于深度学习技术领域,特别涉及一种可解释类深度模型策略逼近算法。包括:步骤一、构建基于卷积神经网络的语义空间策略;步骤二、构建所述语义空间策略的决策树分类模型;步骤三、通过所述语义空间策略生成目标输出,训练所述决策树分类模型。本申请的可解释类深度模型策略逼近算法,建立了卷积神经网络中的可解释模型,在一定程度上,透明化了深度学习中端对端黑箱,并且将卷积神经网络内部过滤器的混沌特征转化为语义上有意义的概念。
-
公开(公告)号:CN116540542A
公开(公告)日:2023-08-04
申请号:CN202310529117.8
申请日:2023-05-11
Applicant: 吉林大学 , 中国航空工业集团公司沈阳飞机设计研究所
IPC: G05B13/04
Abstract: 本发明公开一种人机协同控制策略优化方法、系统及电子设备,涉及人机协同控制领域。该方法包括:构建人类动作意图模型;将1到t时刻的实际人类意图和实际环境状态输入人类动作意图模型得到t+1时刻的人类预期意图;构建机器智能体的动作策略模型;将t时刻的实际人类意图、当前环境状态、t+1时刻的人类预期意图和机器智能体得到的实际价值输入至动作策略模型输出机器智能体动作;在确定人类预期意图和机器智能体动作策略模型输出的机器智能体动作间的相似性后,确定机器智能体的最优动作。本发明以机器智能体对人类操作者的动作意图理解为基础进行控制协同,能够在提高人机协同控制效率和精确性的同时,提高人机交互控制过程的稳定性。
-
公开(公告)号:CN111125448B
公开(公告)日:2023-04-07
申请号:CN201911337772.3
申请日:2019-12-23
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
IPC: G06F16/901 , G06F16/903
Abstract: 本申请提供了一种大规模空中任务决策方法,所述方法包括:获取已知的空中任务决策知识体系;根据已知的空中任务决策知识体系构建空中任务决策的非全区域决策规则;根据所述非全区域决策规则生成全区域决策规则并填入哈希空间中;根据所述哈希空间中的全区域决策规则执行空中任务的决策。与现有技术相比,本申请以现有技术的人类知识为基础,将其解析成若干条不完全划分的决策规则,之后自动生成完全划分的排列组合决策规则并自动映射到哈希解空间,解决了决策系统的规则填写问题,为高维大规模的飞机空中任务决策提供了高效的解决方案。
-
公开(公告)号:CN119150947A
公开(公告)日:2024-12-17
申请号:CN202411175720.1
申请日:2024-08-26
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
IPC: G06N3/092
Abstract: 本申请属于飞机智能辅助控制设计技术领域,具体涉及一种飞机控制辅助提示神经网络策略模型平滑性调整方法,包括:训练得到辅助提示神经网络策略模型;对辅助提示神经网络策略模型进行重训练;对辅助提示神经网络策略模型进行重训练时,对辅助提示神经网络策略模型每一局输出辅助提示策略的基本机动动作进行计数,进而计算得到基于基本机动动作计数的内部激励,该内部激励增加到原有的内部激励中,对辅助提示神经网络策略模型进行深度强化学习训练。
-
公开(公告)号:CN117349168A
公开(公告)日:2024-01-05
申请号:CN202311332874.2
申请日:2023-10-13
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
Abstract: 本申请属于错误定位技术领域,特别涉及一种可解释类深度神经网络条件规则错误定位方法。包括:步骤一、获取条件规则中的所有语句,计算每条语句的可疑度值,并根据语句的可疑度值的大小对语句进行排序;步骤二、获取条件规则中的所有失效执行切片,计算每个失效执行切片的动态失效执行块的可疑度值,并根据动态失效执行块的可疑度值的大小对失效执行切片进行排序;步骤三、根据语句以及失效执行切片的排序,逐一排查失效执行切片的动态失效执行块中的语句,得到错误语句;步骤四、根据错误语句生成补丁规则,并将补丁规则前置于可解释类深度神经网络条件规则模型。本申请能够实现可解释类深度神经网络条件规则模型的错误定位及修改。
-
公开(公告)号:CN117332817A
公开(公告)日:2024-01-02
申请号:CN202311320469.9
申请日:2023-10-12
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
IPC: G06N3/0455 , G06N3/0442 , G06N3/092 , G06N3/09
Abstract: 本申请属于机器学习算法领域,特别涉及一种基于轨迹预测的智能体决策可解释性算法。包括步骤一、训练Transformer模型,并通过训练好的所述Transformer模型进行轨迹预测,得到运动轨迹;步骤二、通过近端策略优化算法PPO对所述运动轨迹进行采样,并基于采样数据对智能体进行决策,得到具有可解释性的策略。本申请的基于轨迹预测的智能体决策可解释性算法,Transformer模型具有很强的预测能力,利用近端策略优化算法PPO通过对手过往的运动轨迹中采样得到数据,对其未来的运动轨迹进行预测,根据预测结果可以做出相应的反馈动作,该预测解释了智能体决策的理由,因此智能体生成的策略具有可解释性。
-
-
-
-
-
-
-
-
-