-
公开(公告)号:CN115204249A
公开(公告)日:2022-10-18
申请号:CN202210533337.3
申请日:2022-05-13
Applicant: 北京理工大学
Abstract: 本发明公开了一种基于竞争机制的群体智能元学习方法,能够减小元学习器参数初始化的影响,同时加快了算法的收敛速度。S1准备元学习所需的多任务数据以及网络模型。S2在外环元学习器最大训练周期内,随机抽取任务,初始化任务上的快速参数。S3,计算损失函数对于网络模型参数的梯度,更新快速参数,重复S3直至内环迭代次数完成,获得该任务上的最终快速参数。S4利用在各任务上的快速参数,更新对应元学习器的参数。S5比较各个元学习器的学习效果,学习效果最好的为winner,其余为loser;winner的参数保持不变,loser的参数向winner的参数方向更新。重复执行S3~S5,直至达到外环元学习器最大训练周期,得到多个具有较强学习效果的元学习器。
-
公开(公告)号:CN115480487B
公开(公告)日:2025-01-17
申请号:CN202211296624.3
申请日:2022-10-21
Applicant: 北京理工大学
Abstract: 本发明提出了一种混合策略驱动的无人机模型预测控制方法,首先,针对无人机执行复杂任务的未知动态环境特点将复杂任务分解为两个目标较为简单的子任务,并设计一种模型预测控制器,根据实时环境的感知信息与对自身状态的估计信息,给出两个子任务代价函数混合的比例系数,使无人机能根据自身与环境的状态变化在子任务间实时切换;通过迭代搜索方式对策略参数进行更新,使策略给出的混合比例系数在任务要求下达到最优;根据无人机对实时环境与自身状态的感知、估计,快速给出较优的子任务代价函数混合比例系数,对无人机在未知环境下执行复杂任务的进一步研究有着重要意义。
-
公开(公告)号:CN115480487A
公开(公告)日:2022-12-16
申请号:CN202211296624.3
申请日:2022-10-21
Applicant: 北京理工大学
Abstract: 本发明提出了一种混合策略驱动的无人机模型预测控制方法,首先,针对无人机执行复杂任务的未知动态环境特点将复杂任务分解为两个目标较为简单的子任务,并设计一种模型预测控制器,根据实时环境的感知信息与对自身状态的估计信息,给出两个子任务代价函数混合的比例系数,使无人机能根据自身与环境的状态变化在子任务间实时切换;通过迭代搜索方式对策略参数进行更新,使策略给出的混合比例系数在任务要求下达到最优;根据无人机对实时环境与自身状态的感知、估计,快速给出较优的子任务代价函数混合比例系数,对无人机在未知环境下执行复杂任务的进一步研究有着重要意义。
-
公开(公告)号:CN119443577A
公开(公告)日:2025-02-14
申请号:CN202411398008.8
申请日:2024-10-09
Applicant: 北京理工大学
IPC: G06Q10/0631 , G06Q50/04 , G06N3/092 , G06N3/045 , G06N3/0985 , G06N3/084
Abstract: 本发明公开了一种基于竞争式元强化学习的作业车间调度方法和系统,首先,构造含有多个不同调度任务类型的任务库,并随机初始化多个调度模型。在每个训练周期,为各调度模型随机抽取一个任务环境,通过行为策略网络与环境的交互生成支持集,并进行模型参数的内环适应性更新。然后,再与一个新环境交互生成查询集,并进行外环元参数更新。最后,基于竞争评价函数比较各调度模型的学习效果,辨别本轮训练中评估最佳的调度模型,并使其他模型的参数朝其参数方向靠拢。重复上述过程,直到训练完成获得多个优质的调度模型。本发明帮助调度模型快速适应不同任务,提高了其自主决策和持续优化能力,对求解现实中复杂、动态的调度问题具有非常重要的意义。
-
公开(公告)号:CN115205577A
公开(公告)日:2022-10-18
申请号:CN202210537246.7
申请日:2022-05-13
Applicant: 北京理工大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明公开了用于图像分类的卷积神经网络的自适应优化训练方法,具有较快的收敛速度,且训练所得模型具有较高的准确率和较强的泛化能力。构建卷积神经网络模型M。从训练图像集合中随机抽取样本B,输入到M,根据输出结果计算损失函数对模型参数的梯度;并计算梯度和梯度差的无偏二阶矩估计。使用梯度和梯度差的无偏二阶矩估计构建参数更新表达式。若M中卷积层数不超过5,则直接使用参数更新表达式对M的参数进行更新,否则在参数更新表达式中加入当前梯度的比例项的影响,构建第二参数更新表达式,对M的参数进行更新。更新参数之后,同时更新当前训练周期,重复训练直到获得训练好的卷积神经网络模型,用于图像分类。
-
-
-
-