[发明专利]一种端到端自动驾驶方法与系统、存储介质在审
| 申请号: | 202111515832.3 | 申请日: | 2021-12-13 |
| 公开(公告)号: | CN116264005A | 公开(公告)日: | 2023-06-16 |
| 发明(设计)人: | 王丹;王玉龙 | 申请(专利权)人: | 广州汽车集团股份有限公司 |
| 主分类号: | G06V20/56 | 分类号: | G06V20/56;G06V10/26;G06V10/764;B60W60/00 |
| 代理公司: | 深圳汇智容达专利商标事务所(普通合伙) 44238 | 代理人: | 徐文城 |
| 地址: | 510030 广东省广州市越秀*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 端到端 自动 驾驶 方法 系统 存储 介质 | ||
1.一种端到端自动驾驶方法,其特征在于,包括如下步骤:
步骤S100、在车辆驾驶过程中,接收当前时刻的车辆前方图像,并对所述当前时刻的车辆前方图像进行语义识别获得当前时刻的第一语义分割图;
步骤S200、将所述当前时刻的车辆前方图像和所述当前时刻的第一语义分割图作为当前时刻的模型输入量一并输入预先训练好的端到端自动驾驶模型进行处理,得到第二语义分割图和所述车辆动作控制信息;其中,所述车辆动作控制信息包括方向盘转角、车辆速度;
其中,所述端到端自动驾驶模型包括概率图模型和驾驶策略模型;所述概率图模型用于根据当前时刻的模型输入量进行推理得到潜在状态变量,并根据所述潜在状态变量进行解码得到第二语义分割图;所述驾驶策略模型用于根据所述概率图模型输出的潜在状态变量进行驾驶决策得到车辆动作控制信息。
2.根据权利要求1所述的方法,其特征在于,所述概率图模型具体用于根据所述当前时刻的模型输入量以及历史时刻的模型输入量和车辆动作进行推理得到潜在状态变量。
3.根据权利要求2所述的方法,其特征在于,所述概率图模型包括滤波模块、潜在动态模块和生成模块,所述滤波模块用于对输入所述概率图模型的模型输入量进行滤波处理,所述潜在动态模块用于根据所述滤波模块的滤波处理结果推理得到潜在状态变量,所述生成模块用于根据所述潜在状态变量进行解码得到第二语义分割图。
4.根据权利要求3所述的方法,其特征在于,所述驾驶策略模型基于最大熵强化学习算法中的随机策略学习算法训练得到。
5.根据权利要求4所述的方法,其特征在于,所述端到端自动驾驶模型的优化目标函数为f=f1+f2,所述概率图模型的优化目标函数为f1,所述驾驶策略模型的优化目标函数为f2;
其中:
表示所述生成模块根据所述潜在状态变量进行解码得到车辆前方图像,为所述第二语义分割图,为所述潜在动态模块推理得到的潜在状态变量,为所述滤波模块的滤波处理结果,x1:t+1为车辆驾驶的初始时刻到t+1时刻的车辆前方图像,a1:t为车辆驾驶的初始时刻到t时刻的车辆动作,m1:t+1为车辆驾驶的初始时刻到t+1时刻的语义分割图,z1:t+H为车辆驾驶的初始时刻到t+H时刻的潜在状态变量,z1:t+1为车辆驾驶的初始时刻到t+1时刻的潜在状态变量,at+1:t+H为车辆驾驶的t+1时刻到t+H时刻的车辆动作,t+1时刻为当前时刻,H大于0,at+H为t+H时刻的车辆动作,zt+H为t+H时刻的潜在状态变量,π(at+H|zt+H)为t+H时刻的驾驶策略,π(at|zt)为t时刻的驾驶策略,P(zt+1|zt,at)为根据t时刻的潜在状态变量和车辆动作预测得到的t+1时刻的潜在状态变量,zt+1为t+1时刻的潜在状态变量,zt为t时刻的潜在状态变量,at为t时刻的车辆动作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州汽车集团股份有限公司,未经广州汽车集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111515832.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种肠炎患者食用的营养食品及制备方法
- 下一篇:一种豆瓣酱生产用高效灭菌工装





