基于好奇心机制下的多智能体经验探索协同方法

    公开(公告)号:CN119150914A

    公开(公告)日:2024-12-17

    申请号:CN202411006183.8

    申请日:2024-07-25

    Abstract: 本发明公开了基于好奇心机制下的多智能体经验探索协同方法,包括构建多智能体决策架构;构建适用于多智能体决策架构的好奇心机制;构建适用于多智能体决策架构的经验探索组件;构建经验回放池与状态回放池;适配多智能体协作对抗环境;对得到的基于好奇心机制下的多智能体经验探索决策架构所构成的深度神经网络进行训练,得到多智能体经验探索协同策略模型;在多智能体经验探索协同策略模型中,对当前对抗场景下的多智能体协作对抗策略进行求解。通过上述方式,本发明能够平衡多智能体算法在训练时探索与利用的过程,缓解多智能体对抗环境中奖励稀疏性所带来的影响,帮助多智能体进行有经验地探索,为对抗寻找的最优策略的同时提高了学习的效率。

    一种基于态势感知交互的兵棋智能体辅助决策方法

    公开(公告)号:CN118966356A

    公开(公告)日:2024-11-15

    申请号:CN202411012209.X

    申请日:2024-07-26

    Abstract: 本发明公开了一种基于态势感知交互的兵棋智能体辅助决策方法,具体步骤包括:获取兵棋智能体所处战场环境的态势感知数据;根据军事要素理论对态势感知数据进行筛选;构建决策动作模块,输入战场态势数据,输出决策动作概率;统计当前作战场景的战场关键数据;将决策动作概率与统计的战场关键数据进行权重集成,并根据智能体编号进行分类;将权重集成数据作为决策辅助信息输入到上层智能体进行决策动作的评判和筛选,对下层智能体进行反馈,生成最优决策动作;通过上述步骤,结合智能兵棋推演系统本发明能够为兵棋智能体提供决策支持,提高智能体决策的效率和准确性。

    一种基于模糊推理的车辆跟驰寻优控制方法

    公开(公告)号:CN111907523A

    公开(公告)日:2020-11-10

    申请号:CN202010616399.1

    申请日:2020-06-30

    Abstract: 本发明公开了一种基于模糊推理的车辆跟驰寻优控制方法,首先对车辆行驶的道路数据进行筛选,获取车辆轨迹数据中的车辆跟驰数据;通过离差平方和公式计算获取的车辆跟驰数据间距离,并将计算结果作为凝聚的层次聚类算法的相似度,以相似度最小为依据,将车辆跟驰数据不断进行合并,最终将车辆跟驰数据划分为多个簇类;通过层次聚类算法,将经过聚类的数据合并到一个簇类,形成树状图层次结构,并设置相似度阈值θ,作为车辆跟驰数据的聚类划分依据,使得车辆跟驰数据划分的聚类结果最优;利用划分结果,构建E(l)度量数据隶属度的价值,进一步设置信任度bel(l);最后使用中心平均去模糊法,本发明解决了现有技术中存在的车辆跟驰研究易受噪声干扰的问题。

Patent Agency Ranking