一种基于免模型强化学习的软件测试方法

    公开(公告)号:CN113918451B

    公开(公告)日:2025-01-21

    申请号:CN202111062056.6

    申请日:2021-09-10

    Abstract: 本申请涉及航空机器学习领域,为一种免模型强化学习的软件测试方法,包括根据要测试的功能集,构建测试条件集C,构建被测软件的观测空间O,构建测试动作空间A,形成测试模拟环境;构建对动作序列执行效果进行奖赏的奖赏函数;构建能够作用于软件本身的动作执行驱动接口;构建能够自我学习的测试策略网络;构建免模型的强化学习损失函数;驱动测试策略网络实时生成软件操作动作并通过动作执行驱动接口作用于软件,进行计算并记录数据元组,存入数据集;所述强化学习损失函数利用数据集优化测试策略网络参数。具有测试效率高、测试时间短、准确性高的技术效果。

    一种基于环境模拟的决策行为预测方法

    公开(公告)号:CN117332691A

    公开(公告)日:2024-01-02

    申请号:CN202311320478.8

    申请日:2023-10-12

    Abstract: 本申请属于人工智能深度学习技术领域,特别涉及一种基于环境模拟的决策行为预测方法。包括:步骤一、构建策略池,所述策略池中包括多个策略模型;步骤二、通过所述策略模型与仿真软件进行交互获取原始数据,所述原始数据包括场景态势数据以及已方决策数据;步骤三、构建原始环境模型,并基于所述原始数据对所述原始环境模型进行有监督训练;步骤四、训练门结构神经网络参数,并将所述门结构神经网络嵌入所述原始环境模型中,得到联合环境模型;步骤五、根据所述策略模型以及所述联合环境模型进行决策行为预测。本申请对于不同的空中环境和空中博弈条件下,能够快速自主学习新环境,有更好的泛化能力,对多种不同的场景态势有更好的演出结果。

Patent Agency Ranking