Invention Grant
- Patent Title: 一种基于深度强化学习的机车智能操纵方法与系统
-
Application No.: CN201710045758.0Application Date: 2017-01-20
-
Publication No.: CN106842925BPublication Date: 2019-10-11
- Inventor: 赵曦滨 , 夏雅楠 , 黄晋 , 卢莎 , 任育琦 , 顾明 , 孙家广
- Applicant: 清华大学 , 中车信息技术有限公司 , 中车大连机车研究所有限公司
- Applicant Address: 北京市海淀区清华园
- Assignee: 清华大学,中车信息技术有限公司,中车大连机车研究所有限公司
- Current Assignee: 清华大学,中车信息技术有限公司,中车大连机车研究所有限公司
- Current Assignee Address: 北京市海淀区清华园
- Agency: 北京律谱知识产权代理事务所
- Agent 罗建书
- Main IPC: G05B13/04
- IPC: G05B13/04

Abstract:
本发明涉及一种基于深度强化学习的机车智能操纵方法与系统,该系统包括数据源模块、机车运行环境学习模块、评价机制学习模块和控制策略学习模块,数据源模块为机车运行环境学习模块和评价机制学习模块提供所需的数据输入,机车运行环境学习模块和评价机制学习模块将分别获得的具体的运行环境和奖赏函数值输出至控制策略学习模块。基于深度强化学习算法,机车运行环境模型以机车操纵动作的实时评价作为反馈信息,通过奖赏或惩罚当前的操纵动作,给控制策略反馈一个奖赏函数作为奖赏评价值,控制策略结合运行状态迭代地进行策略的更新与优化。本发明能更好的实现机车智能优化操纵,并极大地减少了人工参与。
Public/Granted literature
- CN106842925A 一种基于深度强化学习的机车智能操纵方法与系统 Public/Granted day:2017-06-13
Information query