[发明专利]标注包括一组帧的视频流的方法和装置有效
申请号: | 201780052341.5 | 申请日: | 2017-08-21 |
公开(公告)号: | CN109644255B | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 张瑞 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04N7/18 | 分类号: | H04N7/18 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标注 包括 一组 视频 方法 装置 | ||
1.一种标注包括一组帧的视频流的方法,其特征在于,所述方法包括:
扫描所述一组帧中的第一帧以搜索人物,获得所述第一帧中的感兴趣区域的表示,其中,所述感兴趣区域中包括可能包含所述人物的图像;
形成包含所述第一帧中的感兴趣区域的表示的视频轨道;
扫描所述一组帧中的后续帧以搜索所述人物,其中对所述后续帧的扫描从所述后续帧的前一帧中所述感兴趣区域的位置在所述后续帧的位置处开始,获得所述后续帧中的感兴趣区域的表示;
向所述视频轨道添加所述后续帧中的感兴趣区域的表示;
当所述视频轨道中的至少一个感兴趣区域的表示指示特定人物且不指示其他人物时,为所述视频轨道设置正标签,其中,所述正标签表示所述视频轨道指示包含所述特定人物的图像;
提供所述设置有正标签的视频轨道用于训练相似性模型,以使训练后的所述相似性模型用于识别所述特定人物。
2.根据权利要求1所述的方法,其特征在于,所述第一帧中的所述感兴趣区域的所述表示包括指示所述感兴趣区域的位置和尺寸的一组坐标。
3.根据权利要求1或2所述的方法,其特征在于,所述第一帧中的所述感兴趣区域的所述表示包括从所述第一帧中的所述感兴趣区域中提取的图像数据。
4.根据权利要求1或2所述的方法,其特征在于,还包括:
在显示设备上显示所述视频轨道。
5.根据权利要求1或2所述的方法,其特征在于,所述设置有正标签的视频轨道中指示所述特定人物的感兴趣区域的表示的数量小于所述设置有所述正标签的视频轨道中的感兴趣区域的表示的总数量。
6.根据权利要求1或2所述的方法,其特征在于,所述视频流包含不止一个人物的图像,并且所述视频轨道包括多个视频轨道,其中所述多个视频轨道中的每一个对应于相应所述不止一个人物中的每一个。
7.根据权利要求1或2所述的方法,其特征在于,所述第一帧和所述后续帧是所述视频流中的连续帧。
8.根据权利要求1或2所述的方法,其特征在于,所述扫描所述第一帧包括分析像素数据。
9.根据权利要求8所述的方法,其特征在于,所述分析包括基于所述像素数据计算元数据。
10.根据权利要求1、2、9中任一项所述的方法,其特征在于,所述扫描所述第一帧包括:
分析滑动窗口内包含的所述第一帧的一部分;以及
确定所述一部分包含所述人物的概率。
11.一种标注包括一组帧的视频流的系统,其特征在于,所述系统包括:
处理器;
存储器,存储有由所述处理器执行的计算机可读指令,所述指令包括:
视频分析模块,用于产生视频轨道,所述视频分析模块包括:
人体检测模块,用于扫描所述一组帧中的图像数据以搜索人物,获得所述一组帧中的感兴趣区域的表示,其中,所述感兴趣区域中包括可能包含所述人物的图像;
视觉特征提取模块,用于向所述视频轨道添加所述一组帧中的感兴趣区域的表示;
人体跟踪模块,用于基于前一帧中的感兴趣区域的位置来确定在所述一组帧中的各个帧的所述扫描的起始位置;
标记模块,用于当所述视频轨道中的至少一个所述感兴趣区域的表示指示特定人物且不指示其他人物时,为所述视频轨道设置正标签,其中,所述正标签表示所述视频轨道指示包含所述特定人物的图像;以及
存储设备,用于存储所述设置有正标签的视频轨道;
所述存储设备,还用于提供所述设置有正标签的视频轨道用于训练相似性模型,以使训练后的所述相似性模型用于识别所述特定人物。
12.根据权利要求11所述的系统,其特征在于,所述感兴趣区域的所述表示包括指示所述感兴趣区域的位置和尺寸的一组坐标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780052341.5/1.html,转载请声明来源钻瓜专利网。