[发明专利]一种基于RoboSim的自动驾驶行为决策模型的构建方法在审
申请号: | 202210286994.2 | 申请日: | 2022-03-23 |
公开(公告)号: | CN115034281A | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 杜德慧;李博;陈洁娜;张馨元 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G07C5/08;B60W60/00 |
代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 robosim 自动 驾驶 行为 决策 模型 构建 方法 | ||
1.一种基于RoboSim的自动驾驶行为决策模型的构建方法,其特征在于,该方法包括以下具体步骤:
A:基于驾驶场景中元素之间的层次性和关联性,提取驾驶场景中的车辆状态、驾驶环境、车辆驾驶行为决策元素的语义信息,构建自动驾驶领域本体概念模型;
B:针对驾驶场景中周围车辆未来运动状态的随机性,基于车辆轨迹数据,构建LSTM模型进行他车意图预测;
C:基于自动驾驶领域本体概念模型、他车意图预测LSTM模型的预测结果和车辆轨迹数据,构建面向自动驾驶行为决策的贝叶斯网络进行贝叶斯推理,生成车辆驾驶行为决策信息;
D:基于车辆轨迹数据,结合数据中体现的车辆状态信息、环境信息和贝叶斯网络生成的车辆驾驶行为决策信息,构建面向自动驾驶行为决策的RoboSim模型。
2.根据权利要求1所述的基于RoboSim的自动驾驶行为决策模型的构建方法,其特征在于,步骤A所构建的自动驾驶领域本体概念模型,具体包括:
A1:自身车辆类,描述当前车辆自身的状态,包括当前车辆的速度、加速度、与障碍物之间的相对距离、当前所处车道以及行驶方向;
A2:环境类,表示自动驾驶场景中的环境因素,由行人、车辆、天气、路网结构组成;
A3:行为类,分为纵向行为与横向行为,其中纵向行为包括加速、减速和匀速行驶,横向行为包括向左转、右转和保持当前车道。
3.根据权利要求1所述的基于RoboSim的自动驾驶行为决策模型的构建方法,其特征在于,所述步骤B具体包括:
B1:设计他车意图预测LSTM模型的网络结构,由三个部分组成,分别为输入层、LSTM层以及全连接层;
B2:输入层用于表示每个时间步长内,待预测车辆的历史轨迹数据信息;
B3:LSTM层由LSTM单元体构成,LSTM单元体接收输入层的历史轨迹数据信息以及上一个时刻历史轨迹数据信息的隐藏状态,以更新当前的历史轨迹数据信息的隐藏状态;
B4:全连接层用于接收LSTM层的输出,并对待预测车辆的驾驶意图进行预测,预测的结果输出为左转、右转及直行的概率。
4.根据权利要求1所述的基于RoboSim的自动驾驶行为决策模型的构建方法,所述步骤C具体包括:
C1:基于自动驾驶领域本体概念模型中的三大类别,将贝叶斯网络的节点分为三类并设计分层结构,分别为车辆状态节点、环境因素节点、行为决策节点三类,其中车辆状态节点和环境因素节点为上层父节点,行为决策节点为下层子节点,在环境因素节点内还添加了关于车辆意图预测节点,使用他车意图预测LSTM模型得到的预测结果作为车辆意图预测节点上的概率分布;
C2:基于车辆轨迹数据,进行贝叶斯网络的参数学习,确定贝叶斯网络节点中参数的概率分布;
C3:利用确定的贝叶斯网络节点参数的概率分布,进行贝叶斯网络推理,在给定车辆状态节点和环境因素节点的概率后,计算自动驾驶车辆横向动作和纵向动作的概率,选择概率值最大的横向动作和纵向动作,作为贝叶斯网络生成车辆驾驶行为决策的结果。
5.根据权利要求1所述的基于RoboSim的自动驾驶行为决策模型的构建方法,其特征在于,所述步骤D具体包括:
D1:定义RoboSim模型的状态机体中的状态state,用state表示当前车辆的状态信息,包括车辆当前运行速度、转向角度、车道信息及与其它车辆的相对距离信息;
D2:定义RoboSim模型的状态机体中的迁移transition,transition由一个四元组(source, target, condition, action) 组成,其中source和target为迁移的起始和终止状态,condition 标识了当前环境信息,action 标识了当前的行为决策信息;
D3:为RoboSim模型定义接口、枚举类型和控制器,接口包括环境因素接口Envl、本车状态接口EgoStatel和决策接口Decisionl;接口Envl定义了所有环境因素事件,接口EgoStatel定义了本车的状态,接口Decisionl定义了决策操作;枚举类型用于定义变量的取值,包含速度区间Speed、方向区间Direction、加速度情况Acceleration、天气情况Weather和安全状况IsSafe;控制器通过接口Envl中的事件异步连接,将环境信息传递给状态机体,并通过接口Decitionl接受来自状态机体的车辆决策操作;
D4:基于定义的RoboSim模型的结构,遍历车辆轨迹数据,从数据中体现的车辆初始状态开始,将车辆初始状态作为车辆的当前状态,利用上述贝叶斯网络,根据当前车辆状态信息和数据中体现的环境信息进行贝叶斯推理,生成车辆的驾驶行为决策信息,模拟车辆从当前状态执行生成的驾驶行为决策,计算出车辆的下一个状态,将计算出的新的状态信息保存,同时构建两个状态之间的迁移边,将迁移边信息进行保存,之后将计算出的新的状态作为车辆的当前状态,重复操作,直至数据遍历结束,利用保存的所有状态信息以及迁移边信息,得到承载了车辆状态信息、环境信息及贝叶斯网络生成的车辆驾驶行为决策的RoboSim模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210286994.2/1.html,转载请声明来源钻瓜专利网。