一种强化学习的训练方法及相关装置

Invention Publication

Please log in to see more content

Patent Title: 一种强化学习的训练方法及相关装置
Application No.: CN202210968171.8

Application Date: 2022-08-12
Publication No.: CN117651346A

Publication Date: 2024-03-05
Inventor: 刘鹏 , 郭子阳 , 罗嘉俊 , 舒同欣 , 杨讯 , 颜敏
Applicant: 华为技术有限公司
Applicant Address: 广东省深圳市龙岗区坂田华为总部办公楼
Assignee: 华为技术有限公司
Current Assignee: 华为技术有限公司
Current Assignee Address: 广东省深圳市龙岗区坂田华为总部办公楼
Agency: 广州三环专利商标代理有限公司
Agent 胡丽平
Main IPC: H04W74/00
IPC: H04W74/00 ; H04W48/10 ; H04L5/00 ; G06N20/00 ; G06N3/092

Abstract:

本申请提供了一种强化学习的训练方法及相关装置，该方法包括：根据多个站点的动作，确定第一回报值，第一回报值为多个站点中第一站点的回报值，第一回报值用于第一站点进行强化学习训练；向第一站点发送第一回报值。可以看出，通过根据多个站点的动作确定回报值，使得回报值的计算可以结合用户间的相互影响，提高了回报值的准确性，进而使得站点在利用回报值进行强化学习训练后可以提升实际应用效果。本申请可应用于EHT，或Wi‑Fi7，或Wi‑Fi 8等WLAN系统。

Information query

Chinese Patent Announcement Global Dossier Espacenet

IPC分类:

H	电学
H04	电通信技术
H04W	无线通信网络(广播通信入H04H;使用无线链路来进行非选择性通信的通信系统，如无线扩展入H04M1/72)
H04W74/00	无线信道接入，例如，调度接入或随机接入