[发明专利]一种换道控制方法及装置有效
申请号: | 201711064941.1 | 申请日: | 2017-11-02 |
公开(公告)号: | CN109760681B | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 徐成;邹清全;刘奋;吕成浩;卢远志;田润 | 申请(专利权)人: | 上海汽车集团股份有限公司 |
主分类号: | B60W30/18 | 分类号: | B60W30/18;B60W40/02 |
代理公司: | 北京信远达知识产权代理有限公司 11304 | 代理人: | 魏晓波 |
地址: | 201203 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 控制 方法 装置 | ||
1.一种换道控制方法,其特征在于,所述方法,包括:
获取当前时刻被控车周围环境的当前环境数据;
根据预先得到的动作评价模型和所述当前环境数据,获得当前时刻对换道动作的评分,所述换道动作包括加速度和转向角;
将最高评分对应的换道动作确定为当前时刻的被选换道动作;
根据所述被选换道动作,控制所述被控车动作;
其中,所述动作评价模型的建立方法,具体包括:
获取换道动作训练集,所述换道动作训练集包括多组换道数据,每组换道数据包括一个换道过程中驾驶员控制第一车执行的每个换道动作和执行该换道动作时所述第一车的车速数据及其周围环境的环境数据;
根据所述换道动作训练集,基于卷积神经网络对训练目标函数进行训练,训练收敛后,得到所述动作评价模型q(s,a);
其中,a为当前换道动作,s为当前环境数据,a'为下一时刻的换道动作,s'为下一时刻的环境数据,γ为学习率,R(s)为当前时刻的即时回报。
2.根据权利要求1所述的换道控制方法,其特征在于,
在换道过程中,所述即时回报与第一舒适数据和第二舒适数据正相关,所述即时回报还与第一安全数据和/或第二安全数据正相关;
其中,所述第一舒适数据与所述第一车在预设时间段内横向加速度的变化程度负相关;所述第二舒适数据与所述第一车在所述预设时间段内纵向加速度的变化程度负相关;所述第一安全数据与第一距离和第二车的车速正相关,所述第二车在所述第一车前方且位于待转入车道,所述第一距离为所述第二车与所述第一车的纵向距离,所述第一安全数据还与所述第一车的车速、最大制动减速度和反应时延负相关;所述第二安全数据与第二距离和所述第一车的车速正相关,所述第二距离为第三车与所述第一车的纵向距离,所述第三车在所述第一车后方且位于所述待转入车道,所述第二安全数据还与所述第三车的车速、最大制动减速度和反应时延负相关;
换道结束时,所述即时回报为100。
3.根据权利要求2所述的换道控制方法,其特征在于,在换道过程中,所述即时回报具体为:
其中,[f0,f1]为横向加速度频谱,[f2,f3]为纵向加速度频谱,ax为所述第一车在所述预设时间段内的横向加速度,ay为所述第一车在所述预设时间段内的纵向加速度,y1为所述第一距离,y2为所述第二距离,v1为所述第一车的车速,v2为所述第二车的车速,v3为所述第三车的车速,
amax为k对应车的最大制动减速度,τ为k对应车的反应时延。
4.根据权利要求1所述的换道控制方法,其特征在于,所述根据预先得到的动作评价模型和所述当前环境数据,获得当前时刻对换道动作的评分,具体包括:
将所述当前环境输入所述动作评价模型q(s,a),得到当前时刻的换道动作评分函数q(a);
所述将最高评分对应的换道动作确定为当前时刻的被选换道动作,具体包括:
依据公式确定所述被选换道动作a被选。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海汽车集团股份有限公司,未经上海汽车集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711064941.1/1.html,转载请声明来源钻瓜专利网。