一种人机协同控制策略优化方法、系统及电子设备

    公开(公告)号:CN116540542A

    公开(公告)日:2023-08-04

    申请号:CN202310529117.8

    申请日:2023-05-11

    Abstract: 本发明公开一种人机协同控制策略优化方法、系统及电子设备,涉及人机协同控制领域。该方法包括:构建人类动作意图模型;将1到t时刻的实际人类意图和实际环境状态输入人类动作意图模型得到t+1时刻的人类预期意图;构建机器智能体的动作策略模型;将t时刻的实际人类意图、当前环境状态、t+1时刻的人类预期意图和机器智能体得到的实际价值输入至动作策略模型输出机器智能体动作;在确定人类预期意图和机器智能体动作策略模型输出的机器智能体动作间的相似性后,确定机器智能体的最优动作。本发明以机器智能体对人类操作者的动作意图理解为基础进行控制协同,能够在提高人机协同控制效率和精确性的同时,提高人机交互控制过程的稳定性。

    一种基于轨迹预测的智能体决策可解释性算法

    公开(公告)号:CN117332817A

    公开(公告)日:2024-01-02

    申请号:CN202311320469.9

    申请日:2023-10-12

    Abstract: 本申请属于机器学习算法领域,特别涉及一种基于轨迹预测的智能体决策可解释性算法。包括步骤一、训练Transformer模型,并通过训练好的所述Transformer模型进行轨迹预测,得到运动轨迹;步骤二、通过近端策略优化算法PPO对所述运动轨迹进行采样,并基于采样数据对智能体进行决策,得到具有可解释性的策略。本申请的基于轨迹预测的智能体决策可解释性算法,Transformer模型具有很强的预测能力,利用近端策略优化算法PPO通过对手过往的运动轨迹中采样得到数据,对其未来的运动轨迹进行预测,根据预测结果可以做出相应的反馈动作,该预测解释了智能体决策的理由,因此智能体生成的策略具有可解释性。

Patent Agency Ranking