[发明专利]一种基于注意力机制的行人轨迹预测方法在审
申请号: | 202110176024.2 | 申请日: | 2021-02-09 |
公开(公告)号: | CN113160269A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 杨金福;闫雪;李明爱;李亚萍;李智勇 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06T7/73;G06K9/62 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 行人 轨迹 预测 方法 | ||
1.一种基于注意力的行人轨迹预测方法,该方法根据场景中所有N个行人的过去一段时间的历史轨迹来预测行人的未来轨迹,其特征在于:所述的行人轨迹预测方法包括三个模块,个体注意力编码模块、社会注意力池化模块和门控循环单元解码模块,其中,
所述个体注意力编码模块,用于计算行人自身历史轨迹中隐藏向量的相似性,并输出个体注意力特征矩阵,以获取行人自身在运动过程中的主要影响因素;
所述社会注意力池化模块,用于接收个体注意力编码模块的计算结果,即个体注意力特征矩阵,计算场景中所有行人的历史轨迹中隐藏向量的相似性,并输出综合运动特征矩阵,以获取在运动过程中行人之间的相互影响关系;
所述门控循环单元解码模块,用于接收社会注意力池化模块的计算结果,即综合运动特征矩阵,利用门控循环单元计算并输出行人的未来轨迹坐标;
所述行人轨迹预测方法的整体步骤包括:
(1)获取一段视频,以相同间隔将视频划分为若干帧,每T帧为一组,获取每组中每个行人的轨迹坐标X={(xt,yt)∈R2|t=1,2,...,T};
(2)将一组中每个行人的轨迹坐标输入到个体注意力编码模块中,利用注意力机制计算得到每个行人的个体注意力特征矩阵,以下称该模块中的注意力机制为个体注意力机制;
(3)输入个体注意力特征矩阵到社会注意力池化模块,利用注意力机制计算行人之间的相互影响,得到综合运动特征矩阵,以下称该模块中的注意力机制为社会注意力机制;
(4)输入综合运动特征矩阵到门控循环单元解码模块,通过门控循环单元计算得到未来n帧的行人轨迹坐标;
(5)重复(2)-(4)的步骤,不断输入一组历史轨迹生成一组未来轨迹。
2.根据权利要求1所述的一种基于注意力的行人轨迹预测方法,其特征在于:所述的个体注意力编码模块具体工作过程如下:
(1)输入一组帧中行人的历史轨迹,即T帧行人的绝对位置坐标,一组帧中包括多个行人的历史轨迹;
(2)将每个人的每一帧的绝对坐标减去上一帧的绝对坐标,共得到T帧行人相对于上一帧位置坐标;
(3)将相对坐标输入到全连接层,得到嵌入特征向量et,t=1,2,...,T,嵌入特征向量et构成该组视频中该行人对应的嵌入特征矩阵,一组视频中每个行人都对应一个嵌入特征矩阵,保留第T帧的嵌入特征向量作为门控循环单元解码模块的初始输入;
(5)通过嵌入特征向量,利用个体注意力机制计算得到每个行人的个体注意力特征矩阵Tim,具体过程如下:
将嵌入特征矩阵分别与三个不同的矩阵相乘,即查询权重矩阵、键权重矩阵和值权重矩阵,分别得到查询矩阵Q、键矩阵K和值矩阵V,并设置注意力机制中的dk;
计算得到个体注意力特征矩阵,具体计算公式如下:
其中,一个行人的个体注意力特征矩阵Tim是由该行人的每帧对应的个体注意力特征向量timt组成的,即Tim={timt|t=1,2,...,T}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110176024.2/1.html,转载请声明来源钻瓜专利网。