-
公开(公告)号:CN118863099B
公开(公告)日:2025-01-03
申请号:CN202411340664.2
申请日:2024-09-25
Applicant: 北京理工大学
IPC: G06N20/00
Abstract: 本申请公开了基于梯度方差减小和数据重排的模型训练方法,涉及计算机技术领域,方法包括:获取待训练模型对应的初始的模型参数及样本序列;在迭代周期开始时,对样本序列进行重排;在当前迭代周期,确定样本序列中样本在当前迭代周期开始时的样本平均梯度;依次选取目标样本,确定目标样本在当前模型参数下的样本当前梯度,根据样本平均梯度调整样本当前梯度获得样本调整梯度,根据样本调整梯度更新模型参数;若样本遍历完毕,则进入下一个迭代周期并返回执行对样本序列进行重排的步骤,直至满足预设的训练终止条件并获得训练完成时的模型参数。如此,能提高模型训练的收敛速度、训练速率和训练效果。
-
公开(公告)号:CN118113063A
公开(公告)日:2024-05-31
申请号:CN202410235029.1
申请日:2024-03-01
Applicant: 中国航空工业集团公司沈阳飞机设计研究所 , 北京理工大学
IPC: G05D1/495 , G05D1/46 , G05D101/10 , G05D109/20
Abstract: 本发明公开一种基于时变参数估计与裕度自配置的飞行器控制方法及设备,涉及飞行器控制技术领域,方法包括:根据参数估计器实时估计飞行器的非线性角动量方程中未知参数;所述未知参数包括未知力矩和操纵面效率系数;采用具有相位裕度补偿的自适应控制律计算操纵面偏角;当所述未知参数的估计值满足期望估计精度时将所述未知参数的估计值应用到所述具有相位裕度补偿的自适应控制律中;根据所述操纵面偏角控制所述飞行器。本发明提高了飞行控制的稳定性。
-
公开(公告)号:CN117873122A
公开(公告)日:2024-04-12
申请号:CN202311649621.8
申请日:2023-12-04
Applicant: 北京理工大学
IPC: G05D1/46 , G05D109/20
Abstract: 本发明公开了一种基于强化学习的异构集群无人系统的分布式编队控制方法。本发明在传统最优控制的基础上引入强化学习方法,利用在线状态和输入信息迭代求解代数黎卡提方程,并且所有迭代都能够通过在固定的时间间隔内重复使用相同的状态和输入信息来进行,而不使用显式的、先验的系统内部动力学知识,能够摆脱现有关于多智能体系统编队控制的研究中对精确系统模型的较强依赖性;通过强化学习方法学习最优控制策略,平衡编队性能与能耗,在完成编队任务的同时满足代价最小。
-
公开(公告)号:CN117319169B
公开(公告)日:2024-02-27
申请号:CN202311599125.6
申请日:2023-11-28
Applicant: 北京理工大学
IPC: H04L41/042 , H04L41/0823 , H04L41/12
Abstract: 本发明公开了多智能体系统分布式优化方法、装置、终端及存储介质,涉及控制和信息技术领域。本发明通过智能体的状态信息判断当前时刻是否为事件触发时刻,只有在事件触发时刻才会使智能体与邻居智能体之间进行通信。通过事件触发机制可以有效地控制分布式优化过程中的通信成本。解决了现有技术中分布式优化算法采用周期性通信机制,智能体在每次迭代时均要与邻居智能体进行通信,导致通信成本较高的问题。
-
公开(公告)号:CN117389274A
公开(公告)日:2024-01-12
申请号:CN202311433980.X
申请日:2023-10-31
Applicant: 北京理工大学
IPC: G05D1/43 , G05D1/693 , G05D1/692 , G05D1/648 , G05D1/695 , G05D109/10 , G05D109/20
Abstract: 本发明公开了一种二阶多智能体系统预设性能编队控制方法、装置,所述方法通过根据多智能体系统中各智能体对应的位置和速度建立二阶运动学模型;基于二阶运动学模型对通信网络和期望队形进行建模;根据通信网络和期望队形,设置所述多智能体系统编队过程中的预定性能要求;根据预定性能要求,采用预定性能控制方法和控制障碍函数确定多智能体系统的控制输入;根据控制输入对多智能体系统中的各智能体进行控制。由于本发明通过设置预定性能要求,并结合控制障碍函数和预定性能控制方法求解控制输入,解决了现有技术中未对编队进行瞬态和稳态性能的约束,难以在保证连通性和规定性能的同时实现无碰撞编队运动的问题。
-
公开(公告)号:CN116909277A
公开(公告)日:2023-10-20
申请号:CN202310878401.6
申请日:2023-07-18
Applicant: 北京理工大学
IPC: G05D1/02
Abstract: 本发明公开了无需初始镇定学习策略的无人系统轨迹跟踪控制方法,涉及无人系统技术领域,使用本发明能够克服初始镇定控制策略对系统模型的依赖,保证了无人车系统在设计的强化学习控制器下实现对领导者的轨迹跟踪。首先建立无人系统模型;设计跟随者的轨迹跟踪控制器以及对应的代价函数,用于实现对跟随者的最优轨迹跟踪;在无人系统的增广系统的基础上引入偏移因子,构建新的闭环系统;根据新的闭环系统产生系统数据,并收集所述系统数据,利用策略迭代学习算法寻找最优控制策略,以实现无模型且不依赖初始镇定控制策略的轨迹跟踪控制。
-
公开(公告)号:CN116820093A
公开(公告)日:2023-09-29
申请号:CN202310650213.8
申请日:2023-06-02
Applicant: 北京理工大学
IPC: G05D1/02
Abstract: 本发明公开了基于多智能体强化学习的多车协同侦测系统轨迹规划方法,属于机器人智能决策与控制领域。首先构建面向时空信号场侦测任务的多车协同轨迹规划问题的马尔科夫决策过程模型;基于有限元方法估计信号场强度,并将其用以设计无人车侦测轨迹规划的状态空间,并设计动作空间和损失函数;然后建立策略网络和评价网络;再基于多智能体强化学习算法,在无人车每前进一步后训练更新策略网络和评价网络,直至二者收敛;最终得到用于多个无人车轨迹规划的策略网络。本发明在无人车动力学模型和待侦测时空信号场分布均完全未知的情况下解决多个无人车协同侦测时空信号场任务中的轨迹规划问题,使该系统以最短时间获得充足信息并抵达预定目标。
-
公开(公告)号:CN116612345A
公开(公告)日:2023-08-18
申请号:CN202310410048.9
申请日:2023-04-18
Applicant: 北京理工大学
IPC: G06V10/774 , G06V10/82 , G06N3/084 , G06N3/0985 , G06N3/094
Abstract: 本发明公开了一种基于元学习对抗特征的对抗训练方法和系统,涉及图像识别技术领域,能够提升深度神经网络模型的鲁棒性。首先对训练数据集批处理化,得到多个训练批次的数据输入至待训练的深度神经网络模型;对于每个批次的数据,计算神经网络模型的输出结果与该批次对应真实标签之间的损失函数,根据损失函数对初始化扰动进行梯度下降更新,获得该批次的元对抗扰动。选取最优的元对抗扰动,叠加在当前批次数据中,对当前训练批次数据执行梯度下降,并向允许扰动的范围内进行投影,得到当前训练批次数据对应的对抗样本数据。使用对抗样本数据对深度神经网络模型采用梯度下降方法进行训练,得到具备防御对抗攻击效果的鲁棒深度神经网络模型。
-
-
公开(公告)号:CN117950416B
公开(公告)日:2024-08-27
申请号:CN202410079148.2
申请日:2024-01-18
Applicant: 中国航空工业集团公司沈阳飞机设计研究所 , 北京理工大学
IPC: G05D1/46 , G05D109/20
Abstract: 本发明公开一种高超声速飞行器自适应控制方法、系统、设备及介质,涉及飞行器控制技术领域,该方法包括:判断高超声速飞行器的预设飞行参数是否已知;若是,则基于预设飞行参数和高超声速飞行器的刚体动力学模型,确定状态反馈矩阵分解自适应控制律;若否,则采用高增益观测器对预设飞行参数进行估计,基于预设飞行参数的估计值和高超声速飞行器的刚体动力学模型,确定输出反馈矩阵分解自适应控制律;状态反馈矩阵分解自适应控制律和输出反馈矩阵分解自适应控制律的分母均为单位矩阵与参数矩阵之和,状态反馈矩阵分解自适应控制律和输出反馈矩阵分解自适应控制律均用于控制油门开度和升降舵偏。本发明提高了飞行控制的稳定性。
-
-
-
-
-
-
-
-
-