-
公开(公告)号:CN118810815A
公开(公告)日:2024-10-22
申请号:CN202310410978.4
申请日:2023-04-17
IPC: B60W60/00
Abstract: 本申请公开了一种自动驾驶策略选取方法、系统、电子设备及存储介质,该方法包括:获取自动驾驶车辆的当前驾驶场景的第一场景信息,第一场景信息包括自动驾驶车辆自身的第一状态信息和交通参与物的第二状态信息;基于第一状态信息,制定多个具有不同保守度的驾驶策略,以形成驾驶策略集合;基于第二状态信息,确定自动驾驶车辆采用各个驾驶策略的安全风险,生成用于表征安全风险程度的风险信息;基于风险信息,从驾驶策略集合中选取安全风险符合安全条件的驾驶策略,作为自动驾驶车辆应对当前驾驶场景的目标驾驶策略。如此,即使是面对长尾场景,也能够选取出安全风险相对较低的驾驶策略,在一定程度上能够保障自动驾驶车辆的行驶安全。
-
公开(公告)号:CN116409341A
公开(公告)日:2023-07-11
申请号:CN202111658863.4
申请日:2021-12-31
Abstract: 本申请公开了一种自动驾驶车辆的决策算法的生成方法、系统及车辆,该方法包括:至少基于处于自动驾驶状态的车辆的第一时序数据,构建仿真环境,其中,第一时序数据至少包括处于自动驾驶状态的车辆的第一行动数据,以及车辆与第一外部对象的第一环境交互信息;获取处于接管场景下的车辆的第二时序数据,其中,接管场景为车辆退出自动驾驶状态一定时间段内的驾驶场景;基于车辆的第二时序数据,利用构建的仿真环境,生成车辆的仿真环境数据,其中,仿真环境数据为在仿真环境中,处于接管场景下的车辆相关数据;至少利用仿真环境数据,生成用于自动驾驶车辆的决策算法。该方法在保证车辆安全的情况下,提高决策算法的准确性以及生成效率。
-
公开(公告)号:CN114818484A
公开(公告)日:2022-07-29
申请号:CN202210401858.3
申请日:2022-04-18
Applicant: 清华大学
Abstract: 本申请涉及一种驾驶环境模型的训练方法及装置、驾驶环境信息的预测方法及装置、计算机设备、存储介质和计算机程序产品。所述方法包括:构建初始环境模型,初始环境模型包含多个单体模型;获取各单体模型对应的训练样本集,并通过各训练样本集训练对应的单体模型,得到训练后的环境模型;将测试样本输入至训练后的环境模型,得到各训练后的单体模型对应的下一时刻的驾驶环境预测信息;测试样本包含当前时刻的驾驶环境样本信息和当前决策动作样本信息;计算各下一时刻的驾驶环境预测信息的差异度,并在差异度小于预设阈值的情况下,将训练后的环境模型确定为驾驶环境模型。采用本方法能够节约训练驾驶环境模型的过程中真实驾驶数据的使用量。
-
公开(公告)号:CN111413974B
公开(公告)日:2021-03-30
申请号:CN202010236474.1
申请日:2020-03-30
Applicant: 清华大学
IPC: G05D1/02
Abstract: 本发明涉及一种基于学习采样式的汽车自动驾驶运动规划方法及系统,其包括:建立车辆运动学模型;初始化Open表和Closed表;计算每条前向仿真轨迹的评价值,选取评价值最高的轨迹作为规则最优轨迹;对前向仿真轨迹进行Q值函数估计,选择Q值最大的轨迹作为强化学习轨迹;从规则最优轨迹和强化学习轨迹中选取初段最优轨迹,并存入Closed表中;利用碰撞检测方法筛选不碰撞前向仿真轨迹,将不碰撞的前向仿真轨迹存入Open表中;计算每条前向仿真轨迹的评价值,选取评价值最高的前向仿真轨迹作为候选最优轨迹,并存入Closed表中;候选最优轨迹终点在运动规划所需求的终点范围内时结束运动规划过程;将Closed表格中的初段最优轨迹和候选最优轨迹连接,形成最终规划轨迹。
-
公开(公告)号:CN115795808A
公开(公告)日:2023-03-14
申请号:CN202211391599.7
申请日:2022-11-08
Applicant: 清华大学
Abstract: 本发明涉及一种自动驾驶决策危险场景生成方法、系统、设备及介质,包括:提取实车道路测试中自动驾驶车辆发生司机接管情况时的场景的静态要素信息和动态要素信息;根据提取的静态要素信息和动态要素信息,建立动态要素行为模型;设定动态要素行为模型的参数空间,确定每次模拟仿真测试中动态要素行为模型的参数组合,并构建危险场景;对构建出危险场景的参数组合进行聚类和拟合,生成该参数组合下的危险场景区域,本发明能够实现危险场景的高效生成,可以广泛应用于智能车辆领域中。
-
公开(公告)号:CN113879323B
公开(公告)日:2023-03-14
申请号:CN202111246972.5
申请日:2021-10-26
Applicant: 清华大学
Abstract: 本发明涉及一种可信赖学习型自动驾驶决策方法、系统、存储介质及设备,其包括:基于预先设定的决策问题构建可解释性决策,由所述可解释性决策引导所述学习型决策训练;由所述决策问题对学习型决策进行训练,得到具有高价值的决策价值函数的学习型决策;选取所述学习型决策和所述可解释性决策两者中价值高的决策,作为最终可信赖的学习型决策动作。本发明能实现对自动驾驶汽车学习型决策的可信赖度保障,以保证自动驾驶汽车的高可信赖性。本发明可以广泛在自动驾驶技术领域中应用。
-
公开(公告)号:CN115158338A
公开(公告)日:2022-10-11
申请号:CN202210866309.3
申请日:2022-07-22
Applicant: 清华大学
Abstract: 本发明属于自动驾驶技术领域,涉及一种基于动态道路结构信息的自动驾驶系统、方法和介质,一种基于动态道路结构信息的自动驾驶系统,包括:道路信息构建模块,用于提取道路结构信息;归一化决策生成模块,用于根据道路结构信息生成自动驾驶策略,并将与自动驾驶策略对应的策略动作发送至自动驾驶环境;自动驾驶环境,用于根据策略动作进行自动驾驶,并获得下一时刻的状态和奖励函数,并将下一时刻的状态和奖励函数发送至道路信息构建模块和归一化决策生成模块;归一化决策生成模块根据实时道路结构、下一时刻的状态和奖励函数对自动驾驶策略进行调整。其能够实现多种道路结构复合作用的强化学习决策算法结果提升。
-
公开(公告)号:CN114818484B
公开(公告)日:2024-09-27
申请号:CN202210401858.3
申请日:2022-04-18
Applicant: 清华大学
IPC: G06F30/27 , G06F18/214 , G06F17/18
Abstract: 本申请涉及一种驾驶环境模型的训练方法及装置、驾驶环境信息的预测方法及装置、计算机设备、存储介质和计算机程序产品。所述方法包括:构建初始环境模型,初始环境模型包含多个单体模型;获取各单体模型对应的训练样本集,并通过各训练样本集训练对应的单体模型,得到训练后的环境模型;将测试样本输入至训练后的环境模型,得到各训练后的单体模型对应的下一时刻的驾驶环境预测信息;测试样本包含当前时刻的驾驶环境样本信息和当前决策动作样本信息;计算各下一时刻的驾驶环境预测信息的差异度,并在差异度小于预设阈值的情况下,将训练后的环境模型确定为驾驶环境模型。采用本方法能够节约训练驾驶环境模型的过程中真实驾驶数据的使用量。
-
公开(公告)号:CN116118772A
公开(公告)日:2023-05-16
申请号:CN202211463660.4
申请日:2022-11-22
Applicant: 清华大学
IPC: B60W60/00
Abstract: 本发明涉及一种考虑不确定性的自动驾驶强化学习运动规划方法和系统,包括以下步骤:基于获取的历史驾驶数据,使用深度强化学习方法对预先构建的多头值函数网络进行训练;获取当前时刻的环境状态信息,并分别利用训练得到的多头值函数网络和自动驾驶车辆的自动驾驶系统得到基于数据拟合的运动轨迹和基于规则的运动轨迹,比较后得到自动驾驶车辆的最优运动轨迹。通过结合自举式不确定性估计,考虑了强化学习算法在计算过程中可能由于其黑箱特性导致的不确定性,通过基于规则的方法避免了这种不确定性可能造成的危险决策,有助于提升该类方法在智能车辆中使用的安全性和可靠性。因此,本发明可以广泛应用于智能车辆领域。
-
公开(公告)号:CN111413974A
公开(公告)日:2020-07-14
申请号:CN202010236474.1
申请日:2020-03-30
Applicant: 清华大学
IPC: G05D1/02
Abstract: 本发明涉及一种基于学习采样式的汽车自动驾驶运动规划方法及系统,其包括:建立车辆运动学模型;初始化Open表和Closed表;计算每条前向仿真轨迹的评价值,选取评价值最高的轨迹作为规则最优轨迹;对前向仿真轨迹进行Q值函数估计,选择Q值最大的轨迹作为强化学习轨迹;从规则最优轨迹和强化学习轨迹中选取初段最优轨迹,并存入Closed表中;利用碰撞检测方法筛选不碰撞前向仿真轨迹,将不碰撞的前向仿真轨迹存入Open表中;计算每条前向仿真轨迹的评价值,选取评价值最高的前向仿真轨迹作为候选最优轨迹,并存入Closed表中;候选最优轨迹终点在运动规划所需求的终点范围内时结束运动规划过程;将Closed表格中的初段最优轨迹和候选最优轨迹连接,形成最终规划轨迹。
-
-
-
-
-
-
-
-
-