[发明专利]从视频中检测目标对象的方法、装置和电子设备在审

申请号：	202010171460.6	申请日：	2020-03-12
公开（公告）号：	CN113393491A	公开（公告）日：	2021-09-14
发明（设计）人：	刘晓宇;叶挺孟;任海兵	申请（专利权）人：	阿里巴巴集团控股有限公司
主分类号：	G06T7/246	分类号：	G06T7/246;G06T7/215
代理公司：	北京彩和律师事务所 11688	代理人：	刘磊;闫桑田
地址：	英属开曼群岛大开***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	视频检测目标对象方法装置电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种从视频中检测目标对象的方法，包括：

获取视频的当前帧的当前特征图和先前帧的先前特征图；

基于所述当前特征图和所述先前特征图之间的相关性对所述当前特征图进行加权以获得注意力图；

将所述注意力图与所述当前特征图融合获得最终特征图；以及

基于所述最终特征图从所述当前帧中检测目标对象。

2.根据权利要求1所述的从视频中检测目标对象的方法，其中，获取视频的当前帧的当前特征图和先前帧的先前特征图包括：

获取所述视频的当前帧和先前帧；

通过卷积神经网络从所述先前帧获得所述先前特征图；以及

通过所述卷积神经网络从所述当前帧获得所述当前特征图。

3.根据权利要求1所述的从视频中检测目标对象的方法，其中，基于所述当前特征图和所述先前特征图之间的相关性对所述当前特征图进行加权以获得注意力图包括：

将所述当前特征图通过第一卷积层以获得第一特征图；

将所述先前特征图通过第二卷积层以获得第二特征图；

基于所述第一特征图和所述第二特征图获得用于表示所述当前特征图和所述先前特征图之间的相关性的注意力矩阵。

4.根据权利要求3所述的从视频中检测目标对象的方法，其中，基于所述当前特征图和所述先前特征图之间的相关性对所述当前特征图进行加权以获得注意力图进一步包括；

将所述当前特征图通过第三卷积层以获得第三特征图；以及

以所述注意力矩阵对所述第三特征图进行加权以获得所述注意力图。

5.根据权利要求1所述的从视频中检测目标对象的方法，其中，所述先前帧是所述当前帧的前一帧。

6.根据权利要求1所述的从视频中检测目标对象的方法，其中，将所述注意力图与所述当前特征图融合获得最终特征图包括：

将所述注意力图以预定权重加权后与所述当前特征图融合以获得所述最终特征图。

7.根据权利要求6所述的从视频中检测目标对象的方法，其中，所述预定权重通过训练得到。

8.根据权利要求7所述的从视频中检测目标对象的方法，其中，所述预定权重的训练过程包括：

获取训练视频的当前帧的当前训练特征图和先前帧的先前训练特征图；

基于所述当前训练特征图和所述先前训练特征图之间的相关性对所述当前训练特征图进行加权以获得训练注意力图；

将所述训练注意力图以初始权重加权后与所述当前训练特征图融合以获得所述最终训练特征图；基于所述最终训练特征图计算损失函数值；以及

基于所述损失函数值通过梯度下降更新所述初始权重以获得所述预定权重。

9.根据权利要求1所述的从视频中检测目标对象的方法，其中，所述目标对象的检测结果进一步用于所述目标对象的对象跟踪和/或对象分割。

10.一种视频中的目标对象的分割方法，包括：

获取视频的当前帧的当前特征图和先前帧的先前特征图；

基于所述当前特征图和所述先前特征图之间的相关性对所述当前特征图进行加权以获得注意力图；

将所述注意力图与所述当前特征图融合获得最终特征图；

基于所述最终特征图从所述当前帧中检测目标对象；以及

基于所述目标对象的检测结果生成掩码以分割所述目标对象。

11.一种视频中的目标对象的跟踪方法，包括：

获取视频的当前帧的当前特征图和先前帧的先前特征图；

基于所述当前特征图和所述先前特征图之间的相关性对所述当前特征图进行加权以获得注意力图；

将所述注意力图与所述当前特征图融合获得最终特征图；

基于所述最终特征图从所述当前帧中检测目标对象；以及

基于所述目标对象的检测结果跟踪所述目标对象。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司，未经阿里巴巴集团控股有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010171460.6/1.html，转载请声明来源钻瓜专利网。

上一篇：POI索引库的建立方法、查询方法、更新方法和相关装置
下一篇：应用加载方法、装置、电子设备及可读存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T7-00 图像分析，例如从位像到非位像
G06T7-20 .运动分析
G06T7-40 .结构分析
G06T7-60 .图形属性的分析，例如一个图像的区域、重心、周边

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]从视频中检测目标对象的方法、装置和电子设备在审

专利文献下载