基于强化学习TD3算法的异构无线网络垂直切换方法

Invention Grant

CN113784410B 基于强化学习TD3算法的异构无线网络垂直切换方法失效 - 权利终止

Please log in to see more content

Patent Title: 基于强化学习TD3算法的异构无线网络垂直切换方法
Application No.: CN202111120444.5

Application Date: 2021-09-24
Publication No.: CN113784410B

Publication Date: 2022-09-23
Inventor: 杨晓萍 , 刘水 , 王雪 , 丛玉良 , 钱志鸿 , 谢明桐 , 张菁
Applicant: 吉林大学
Applicant Address: 吉林省长春市前进大街2699号
Assignee: 吉林大学
Current Assignee: 吉林大学
Current Assignee Address: 吉林省长春市前进大街2699号
Agency: 重庆市信立达专利代理事务所
Agent 刘洁
Main IPC: H04W36/14
IPC: H04W36/14 ; H04W36/00

Abstract:

本发明专利公开了基于强化学习TD3算法的异构无线网络垂直切换方法，具体涉及通讯技术领域。包括如下步骤：采用熵权法计算网络状态参数的权重，构造奖励函数；初始化策略网络以及两个估计网络，对上述网络对应的目标网络初始化，并初始化经验池；演员当前网络根据网络状态参数做出切换决策，求得奖励值；采用梯度下降法训练评论家当前网络，采用梯度上升法训练演员当前网络，更新演员目标网络参数和评论家目标网络参数；在每个决策时刻进行S4‑S5的操作步骤，训练更新网络参数；根据训练好的策略网络来确定最优的切换策略。采用本发明技术方案解决了深度强化学习汇总网络参数状态动作值过高估计的问题，可用于快速选出最优切换决策。

Public/Granted literature

CN113784410A 基于强化学习TD3算法的异构无线网络垂直切换方法 Public/Granted day:2021-12-10

Information query

Chinese Patent Announcement Global Dossier Espacenet

IPC分类:

H	电学
H04	电通信技术
H04W	无线通信网络(广播通信入H04H;使用无线链路来进行非选择性通信的通信系统，如无线扩展入H04M1/72)
H04W36/00	切换或重选装置
H04W36/14	.重选网络或空中接口