[发明专利]一种无人驾驶车辆控制模型在线增量式学习方法在审
申请号: | 201910777721.6 | 申请日: | 2019-08-22 |
公开(公告)号: | CN110456799A | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 张卫忠 | 申请(专利权)人: | 合肥云驾智能科技有限公司 |
主分类号: | G05D1/02 | 分类号: | G05D1/02;G05B13/04 |
代理公司: | 34158 合肥方舟知识产权代理事务所(普通合伙) | 代理人: | 刘跃<国际申请>=<国际公布>=<进入国 |
地址: | 230071安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 控制模型 预定义 云端 上传 无人驾驶车辆控制 数据采集系统 在线学习过程 在线学习系统 驾驶 传感器数据 增量式更新 增量式学习 动作序列 基于机器 精度误差 实时输出 实时数据 数据缓存 验证数据 在线学习 输出 验证集 触发 更新 存储 开车 验证 优化 学习 | ||
1.一种无人驾驶车辆控制模型在线增量式学习方法,其特征在于:包括有无人驾驶车辆控制模型、云端在线学习系统和车端数据采集系统,所述的无人驾驶车辆控制模型是由基于深度学习的端到端模型构成的;所述的云端在线学习系统通过利用车端数据采集系统采集的训练数据,采用在线学习算法对当前的无人驾驶车辆控制模型进行在线学习更新,然后对更新后的控制模型进行验证,通过比较更新后的控制模型与更新前的控制模型的精度差别,确定是否下传更新的控制模型;每次学习后,用学习更新后的控制模型替换原来的控制模型,保持控制模型的不断更新;所述的车端数据采集系统运行无人驾驶车辆控制模型时通过驾驶员控制无人驾驶车辆的动作执行,然后计算控制模型的输出值与驾驶员实时输出的驾驶动作的差别,若差别大于预定义阈值,则将数据缓存中存储的固定时间长度的多个传感器数据与驾驶动作序列关键数据上传至云端,触发当前控制模型的在线学习过程。
2.根据权利要求1所述的一种无人驾驶车辆控制模型在线增量式学习方法,其特征在于:所述的无人驾驶车辆控制模型是一个时变模型,控制模型Mt表示如下:
Mt=f(I1:t,θt)
其中,It表示t时刻的训练数据集合,θt表示t时刻控制模型的参数。
3.根据权利要求2所述的一种无人驾驶车辆控制模型在线增量式学习方法,其特征在于:所述的车端数据采集系统采集的训练数据是由一定时间段内的多个传感器数据与驾驶动作序列组成:
It={d1,d2,...,dn}
上式中,It表示t时刻车端上传的训练数据序列,di表示一个训练样本,n为样本数量,i表示样本序号,di表示为:
di=(s1,s2,...,sm,throttle,steering,brake)
其中,s1,s2,…,sm表示多个传感器数据,throttle表示采集的车辆油门值,steering表示采集的车辆转向值,brake表示采集的车辆制动值,m表示传感器数量。
4.根据权利要求3所述的一种无人驾驶车辆控制模型在线增量式学习方法,其特征在于:所述的在线学习算法是基于批量梯度下降法进行训练,网络权值更新公式为:
其中,W为网络权重,L(Wt)为损失函数,η为学习速率,为求梯度符号,损失函数定义为:
其中,为当前控制模型预测输出,ch为当前训练数据控制输出真值,p为每次车端上传的训练数据的批量大小。
5.根据权利要求4所述的一种无人驾驶车辆控制模型在线增量式学习方法,其特征在于:所述的对更新后的控制模型进行验证,具体是在验证数据集上进行验证,验证数据集采用在线更新的策略,其更新策略为在前一时刻验证集的基础上,按比例加入新训练数据集中的部分数据,即:
其中,Vt表示t时刻的验证数据集,α为当前训练数据集拾取比例,为集合并操作。
6.根据权利要求5所述的一种无人驾驶车辆控制模型在线增量式学习方法,其特征在于:所述的精度差别的计算方法为:
其中,e1表示模型更新前后在验证集上的损失差异,|Vt|表示t时刻验证集的数量,LOSSj(Mt)表示模型Mt在第j个验证数据上的损失,若e1大于0且大于特定阈值TH1时,下发此更新的模型给车端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥云驾智能科技有限公司,未经合肥云驾智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910777721.6/1.html,转载请声明来源钻瓜专利网。