[发明专利]生成易受伤害道路使用者轨迹预测模型的方法及预测方法有效
| 申请号: | 201910838347.6 | 申请日: | 2019-09-05 |
| 公开(公告)号: | CN110599521B | 公开(公告)日: | 2022-02-15 |
| 发明(设计)人: | 李克强;熊辉;王思佳;王建强 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G06T7/246 | 分类号: | G06T7/246 |
| 代理公司: | 北京汇智胜知识产权代理事务所(普通合伙) 11346 | 代理人: | 石辉;赵立军 |
| 地址: | 10008*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 生成 受伤 道路 使用者 轨迹 预测 模型 方法 | ||
1.一种生成易受伤害道路使用者轨迹预测模型的方法,其特征在于,包括下述步骤:
步骤S1:获取训练集,训练集包括N+M帧时间上连续的图像,且针对所述图像已经标记所有易受伤害道路使用者目标的矩形目标框、类别和跟踪ID序号,所述类别包括行人和骑行者;
步骤S2:筛选训练样本,从训练集中连续的N+M帧图像中根据每个目标真值的跟踪ID序号筛选训练样本,具有相同跟踪ID序号的同一目标的训练样本为一组,共有P组训练样本,P为跟踪ID序号的个数,即已经标记的不同易受伤害道路使用者目标的个数;
步骤S3:提取特征,对于前N帧图像,提取训练样本的时间运动特征、矩形框外观特征和共享的上下文特征,然后融合所述时间运动特征、矩形框外观特征和共享的上下文特征,得到N*P个训练输入向量Xjt+k;对于后M帧图像,只提取训练样本的时间运动特征,得到M*P个训练输出向量Yjt+k;
上标j为易受伤害道路使用者目标的跟踪ID序号,
下标t+k为图像的帧序号,所述帧序号与相应时刻对应,
其中,t表示开始进行预测前的最后一帧图像,即第N帧图像,
Z-表示负整数集合,Z+表示正整数集合;
步骤S4:生成模型,将所述训练输入向量Xjt+k和训练输出向量Yjt+k输入至门控循环单元神经网络,采用预先设计的损失函数进行模型训练,生成易受伤害道路使用者轨迹预测模型;
在生成模型的过程中,单独考虑位置和尺寸的损失,采用的总体的损失函数如下:
Ltotal=lpos+ηlsize
其中,
lpos表示位置损失,lsize表示尺寸损失,
η表示学习权重,
K是所有参与训练的目标个数,
下标i表示全部序列中参与训练的所有目标中第i个目标,
xpred表示预测的矩形框中心点横坐标;ypred表示预测的矩形框中心点纵坐标;
xgt表示真值矩形框的中心点横坐标;ygt表示真值矩形框的中心点纵坐标;
wpred表示矩形框预测宽度;hpred表示矩形框预测高度;
wgt表示矩形框真值宽度;hgt表示矩形框真值高度;
预测结果通过易受伤害道路使用者轨迹预测模型获取,真值直接从训练集中的标记信息中获取。
2.如权利要求1所述的生成易受伤害道路使用者轨迹预测模型的方法,其特征在于,
在步骤S4中,所述门控循环单元神经网络采用双参数激活函数lelu,对于每一组训练样本,进行从组内训练输入向量Xt-N+1:t到组内训练输出向量Yt+1:M的参数映射学习,双参数激活函数lelu如下:
其中,C为常数;α和β为变量,通过训练样本数据自学习而确定,具体地,在组内训练输入向量Xt-N+1:t到组内训练输出向量Yt+1:M的参数映射学习中自适应学习,z为变量,是循环神经网络中隐藏神经元的输入,由历史输入与当前输入线性组合而成,
t-N+1:t,表示从前N帧图像到当前帧图像,即从第1帧至第N帧;
t+1:M,表示当前帧的未来连续M帧,即从第N+1帧至第N+M帧。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910838347.6/1.html,转载请声明来源钻瓜专利网。





