-
公开(公告)号:CN115526387A
公开(公告)日:2022-12-27
申请号:CN202211130610.4
申请日:2022-09-16
Applicant: 暨南大学
Abstract: 本发明公开了一种基于强化学习和动态定价机制的寻客路径推荐方法,方法包括S1、城市网格划分,将城市地图平均划分为若干网格;S2、司机行为建模,基于马尔可夫决策过程对司机行为和环境进行建模;S3、强化学习求解,对司机行为模型,用Q学习算法求解Q表,得到最优解;S4、寻客路径推荐,根据得到的Q表,向司机推荐在每个状态下的最佳行动。本发明在网格的粒度上为司机推荐寻客路径,最大化司机在每小时内的平均利润率,在考虑动态定价机制的情况下,向司机推荐搜索乘客的路径,实现更高的利润。