-
公开(公告)号:CN116448117A
公开(公告)日:2023-07-18
申请号:CN202310415309.6
申请日:2023-04-18
Applicant: 安徽大学
Abstract: 本发明公开了一种融合深度神经网络和强化学习方法的路径规划方法,步骤一:机器人在每个离散时间步内,通过传感器获取环境信息以建立相应的数学模型;步骤二:建立当前所处的模拟环境模型;步骤三:根据奖励值更新网络参数和学习更优的行为策略;步骤四:解耦目标Q值动作的选择和目标Q值的计算;步骤五:使用深度神经网络表示智能体的各种组件这些网络的参数通过梯度下降来训练;步骤六:通过迭代;步骤七:根据添加噪音引起的网络输出值变化选择动作。本发明新型涉及机器人路径规划技术领域,具体为具体为一种融合深度神经网络和强化学习方法的路径规划方法。