[发明专利]用于处理图像的方法和装置有效
申请号: | 201810875809.7 | 申请日: | 2018-08-03 |
公开(公告)号: | CN109145781B | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 朱延东;许世坤;王长虎 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N20/00 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 处理 图像 方法 装置 | ||
1.一种用于处理图像的方法,包括:
从目标视频中选择目标图像帧,其中,所述目标图像帧包括至少一个目标对象图像;
将所述目标图像帧输入预先训练的目标检测模型,得到至少一个目标位置信息,其中,目标位置信息用于表征目标对象图像在所述目标图像帧中的位置;
将所述至少一个目标位置信息和所述目标图像帧输入预先训练的目标跟踪模型,输出预测位置信息和所述预测位置信息对应的跟踪对象标识信息,其中,所述预测位置信息用于表征跟踪对象映射在所述目标图像帧中的位置,跟踪对象标识信息用于标识跟踪对象,所述目标跟踪模型用于根据历史位置关系数据,对输入的至少一个目标位置信息进行计算,得到预测位置信息和跟踪对象标识信息,历史位置关系数据用于表征输入的至少一个目标位置信息对应的各个目标对象图像的历史位置信息之间的关系;
获取预先存储的跟踪对象图像的历史相关信息,其中,所述跟踪对象图像是所述跟踪对象标识信息指示的跟踪对象的图像,所述历史相关信息是与所述跟踪对象图像相关的、从所述目标视频包括的、位于所述目标图像帧之前的图像帧中提取的信息;
基于所述历史相关信息确定所述目标图像帧中是否包括所述跟踪对象图像;
响应于确定不包括,基于输出的预测位置信息和跟踪对象标识信息,生成用于在所述目标图像帧上显示的位置标记。
2.根据权利要求1所述的方法,其中,所述目标跟踪模型包括卷积神经网络和循环神经网络;以及
所述将所述至少一个目标位置信息和所述目标图像帧输入预先训练的目标跟踪模型,输出预测位置信息和所述预测位置信息对应的跟踪对象标识信息,包括:
将所述至少一个目标位置信息和所述目标图像帧输入所述卷积神经网络,得到与目标位置信息对应的图像特征信息,其中,图像特征信息用于表征目标位置信息对应的目标对象图像的特征;
将所述至少一个目标位置信息和所得到的图像特征信息输入所述循环神经网络,得到预测位置信息和所述预测位置信息对应的跟踪对象标识信息。
3.根据权利要求1所述的方法,其中,在所述将所述至少一个目标位置信息和所述目标图像帧输入预先训练的目标跟踪模型,输出预测位置信息和所述预测位置信息对应的跟踪对象标识信息之后,所述方法还包括:
响应于确定包括,将所述预测位置信息更新为所述跟踪对象图像对应的目标位置信息;
基于更新后的预测位置信息和跟踪对象标识信息,生成用于在所述目标图像帧上显示的位置标记。
4.根据权利要求1-3之一所述的方法,其中,所述目标跟踪模型通过如下步骤训练得到:
获取训练样本集合,其中,训练样本包括样本图像和样本图像对应的标注预测位置信息、标注跟踪对象标识信息,样本图像包括样本跟踪对象图像和至少一个样本目标对象图像,标注预测位置信息用于表征样本跟踪对象图像在样本图像中的位置,标注跟踪对象标识信息用于标识样本跟踪对象图像;
利用机器学习方法,将所述训练样本集合中的训练样本包括的样本图像作为输入,将与输入的样本图像对应的标注预测位置信息和标注跟踪对象标识信息作为期望输出,训练得到目标跟踪模型。
5.根据权利要求4所述的方法,其中,所述将所述训练样本集合中的训练样本包括的样本图像作为输入,将与输入的样本图像对应的标注预测位置信息作为期望输出,训练得到目标跟踪模型,包括:
从所述训练样本集合中选取训练样本,执行以下训练步骤:将选取的训练样本包括的样本图像输入初始模型,得到预测位置信息和跟踪对象标识信息,其中,预测位置信息用于表征样本跟踪对象图像在样本图像中的位置;将所得到的预测位置信息和跟踪对象标识信息分别与对应的标注预测位置信息和标注跟踪对象标识信息进行比较,根据比较结果确定初始模型是否训练完成;响应于确定训练完成,将初始模型确定为目标跟踪模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810875809.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种人脸识别方法
- 下一篇:基于界面任务的视觉认知差异研究方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序