一种多Agent深度强化学习算法
    2.
    发明公开

    公开(公告)号:CN113902087A

    公开(公告)日:2022-01-07

    申请号:CN202111240522.5

    申请日:2021-10-25

    Abstract: 本发明公开了一种多Agent深度强化学习算法,包括:S1:学习的策略在执行时只使用本地信息,即它们自己的观察结果;S2:智能体之间的通信方法不做任何结构上的假设,即不假设一个可区分的通信渠道;S3:leader层网络只输入全局智能体的状态信息,只作用于每个智能体的输出动作值,并不参与每个智能体的策略执行,既保持每个智能体的独立性,又保证所有智能体群体之间的通信。本发明通过在分布式执行之前加入集中式预判分配权重,增强了智能体群体之间的决策通信,提高了Leader_MADDPG在多变的环境关系中智能体训练过程中的稳定性和训练后的鲁棒性。

    基于多Agent环境的深度强化学习算法、设备和存储介质

    公开(公告)号:CN115392438A

    公开(公告)日:2022-11-25

    申请号:CN202211114004.3

    申请日:2022-09-14

    Abstract: 本申请提供一种基于多Agent环境的深度强化学习算法、设备和存储介质,涉及深度强化学习算法技术领域;通过步骤S101、利用Agent中的目标网络,基于初始状态信息和动作信息,确定时间差分;步骤S102、根据预设的遮盖率,对初始状态信息进行随机遮盖,得到目标状态信息,利用Agent中的预测网络,以及时间差分,确定误差值;步骤S103:基于误差值,以及自适应修改参数,对Agent中的预测网络和目标网络各自对应的加权值进行更新;步骤S104:重复步骤S102和步骤S103预设次数,确定目标加权值,从而确定目标深度强化学习模型。具有保证了样本学习效率,并通过自适应修改参数对深度强化学习模型中的Agent进行迭代更新,以提高收敛速度的效果。

    一种基于图卷积的医疗图像分割方法

    公开(公告)号:CN115205306A

    公开(公告)日:2022-10-18

    申请号:CN202210922193.0

    申请日:2022-08-02

    Abstract: 本发明提供了一种基于图卷积的医疗图像分割方法,包括以下步骤:对于监督学习,使用图卷积网络配合卷积神经网络分割框架;先利用全卷积网络提取出医学图像的深层次特征,对提取出来的特征构建图的三元组信息,最后使用图卷积网络进行训练,弥补卷积网络带来的局部位置信息的损失;对于无监督域适应学习,使用双曲图卷积网络融合,对抗学习域适应网络框架。本发明有监督是情况下,通过使用U‑Net网络提取医学图像的特征信息,通过高斯核或朴素方式构建图信息,送入图卷积网络进行训练;无监督情况下,选择使用双曲图卷积模型替代图卷积网络。使用图卷积网络和双曲图卷积网络可以扩大感受范围,提高了分割精度,便捷实用。

    一种基于深度学习和特征融合的皮肤病变图像分割方法

    公开(公告)号:CN115311230A

    公开(公告)日:2022-11-08

    申请号:CN202210941767.9

    申请日:2022-08-08

    Abstract: 本发明提供了一种基于深度学习和特征融合的皮肤病变图像分割方法,建立使用了编码器‑解码器结构的用于皮肤病变图像分割的模型,在模型的特征编码路径上使用EfficientNet进行了特征的学习,在特征解码路径上使用密集特征融合方法增强解码器的解码能力,并且采用了门控完全特征融合模块来提升特征融合的质量,产生解码后的特征图,解码器在最后产生输入图像的分割结果,完成皮肤病变图像的分割处理。本发明使用了更为先进的EfficientNet作为模型的编码器,使得本申请模型编码器的参数数量减少而且特征学习能力增强。通过门控机制增强了有用的编码信息向解码路径的传递,抑制了无用的特征信息所带来的干扰,提升了模型的特征融合能力。

    热能预测消耗确定方法及相关装置

    公开(公告)号:CN116817354A

    公开(公告)日:2023-09-29

    申请号:CN202310766215.3

    申请日:2023-06-27

    Abstract: 本发明公开了一种热能预测消耗确定方法及相关装置,所述热能预测消耗确定方法应用于热能预测消耗确定系统;所述热能调节系统用于对城市的多个供暖系统的供暖情况进行调节,所述热能调节系统包括温度监测器;所述温度监测器用于检测供暖区域的环境温度;通过获取得到的时间信息及不同建筑类型对应的人口热力信息,根据往期的热能消耗值对当前的目标热能预测消耗值进行预测,从而方便供暖系统根据目标热能预测消耗值对供暖情况进行调整,从而解决供暖区域内部分区域供暖热能过剩,部分区域供暖热能不足的情况。

    一种计算机网络安全动态预警方法

    公开(公告)号:CN118200004A

    公开(公告)日:2024-06-14

    申请号:CN202410406424.1

    申请日:2024-04-07

    Abstract: 本发明涉及数据处理领域,具体涉及一种计算机网络安全动态预警方法,用于解决现有的网络安全预警方法无法对异常的网络流量和异常的网络行为进行识别判断,并综合分析判断网络入侵,并及时触发预警机制,导致网络入侵检测准确性不高,网络安全问题仍然得不到有效的改善的问题;该计算机网络安全动态预警方法包括以下模块:网络安全平台、流量监控模块、行为监控模块、数据分析模块以及安全报警模块;该计算机网络安全动态预警方法能够实时监测网络流量,识别异常行为,提高检测的准确性和预警的效果,判断网络入侵,并及时触发预警机制,使用户能够提前采取防范措施,有效保障网络系统的安全稳定运行。

    供暖热能确定方法及相关装置

    公开(公告)号:CN117663239A

    公开(公告)日:2024-03-08

    申请号:CN202410061710.9

    申请日:2024-01-16

    Abstract: 本申请公开了一种供暖热能确定方法及相关装置,所述供暖方法应用于供暖系统,所述供暖系统用于对城市进行供暖,城市内包括多个供暖区域,所述供暖热能确定方法通过城市内每个供暖区域的环境温度、建筑面积、人口数量、往期热能消耗等参数,对城市内每个供暖区域的热能消耗值通过多种计算方式进行确定,并根据计算得到的热能预计消耗值对城市的供暖区域进行供暖,从而提高的对城市供暖热能消耗的计算准确率,进而提高城市供暖的供暖效率。

    基于多Agent环境的深度强化学习算法、设备和存储介质

    公开(公告)号:CN115392438B

    公开(公告)日:2023-07-07

    申请号:CN202211114004.3

    申请日:2022-09-14

    Abstract: 本申请提供一种基于多Agent环境的深度强化学习算法、设备和存储介质,涉及深度强化学习算法技术领域;通过步骤S101、利用Agent中的目标网络,基于初始状态信息和动作信息,确定时间差分;步骤S102、根据预设的遮盖率,对初始状态信息进行随机遮盖,得到目标状态信息,利用Agent中的预测网络,以及时间差分,确定误差值;步骤S103:基于误差值,以及自适应修改参数,对Agent中的预测网络和目标网络各自对应的加权值进行更新;步骤S104:重复步骤S102和步骤S103预设次数,确定目标加权值,从而确定目标深度强化学习模型。具有保证了样本学习效率,并通过自适应修改参数对深度强化学习模型中的Agent进行迭代更新,以提高收敛速度的效果。

Patent Agency Ranking