[发明专利]一种优化视频目标检测、识别或分割的精度和效率的方法在审
申请号: | 202011124541.7 | 申请日: | 2020-10-20 |
公开(公告)号: | CN112417963A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 赵维杰;富宸;徐孝成 | 申请(专利权)人: | 上海卫莎网络科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/62;G06N3/04 |
代理公司: | 上海国瓴律师事务所 31363 | 代理人: | 傅耀 |
地址: | 200030 上海市徐汇区天*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 优化 视频 目标 检测 识别 分割 精度 效率 方法 | ||
本发明提供了一种优化视频目标检测、识别或分割的精度和效率的方法,其特征在于:给定一段视频序列帧,获得当前帧的识别结果,预测后续待处理帧的待检测子区域,然后仅在该待检测子区域中进行识别计算。其中本发明的有益效果是:本方法利用邻近帧的识别结果,先预测当前帧的待检测子区域,再在含有目标物的待检测子区域进行处理,不需要对无关背景进行处理,极大的减少了处理所需的运算量,提升了运算效率;同时,由于运算主要集中在含有目标物的子区域,与传统技术相比,采用本发明进行检测、识别或分割处理的准确率更高。
技术领域
本发明涉及视频处理领域,特别涉及一种优化视频目标检测、识别或分割的精度和效率的方法。
背景技术
视频目标检测、识别或分割是计算机视觉核心问题之一,广泛应用于工业制造、自动驾驶、安防、新零售、影视文娱业等各种工业场景。高精度和高效率一直是视频目标检测、识别和分割问题的重点和难点。
然而现有技术中视频目标检测、识别或分割系统的处理精度通常比较低,运算耗时比较长,且无法有效的对于多目标小目标进行检测、识别或分割处理。
发明内容
为了解决上述技术问题,本发明中披露了一种优化视频目标检测、识别或分割的精度和效率的方法,本发明的技术方案是这样实施的:
给定一段视频序列帧,获得当前帧的识别结果,预测后续待处理帧的待检测子区域,然后仅在该待检测子区域中进行识别计算。
优选地,所述方法包括步骤如下:
S1:通过识别模块计算与后处理得到当前帧目标物的初步识别结果;
S2:通过初步识别结果计算得到当前帧目标物的待检测子区域;
S3:通过识别模块仅对当前帧目标物的待检测子区域进行预测,得到优化后的识别结果和对应目标物的精确子区域;
S3.1:根据优化后的识别结果和目标物的精确子区域得到当前帧视频的最终处理结果;
S4:仅对当前帧得到的目标物的精确子区域进行位置预测后得到下一待处理帧目标物的待检测子区域;
S5:下一待处理帧目标物的待检测子区域作为当前帧目标物的待检测子区域并回到S3。
优选地,还包括S4.1:下一待处理帧目标物的待检测子区域与S3中的目标物的精确子区域id保持一致。
优选地,所述S1中目标物的数量为2个或2个以上。
优选地,还包括S4.2:通过分析模块仅判断下一待处理帧目标物的待检测子区域与S3中的目标物的精确子区域id是否一致;如果一致,进行S5,如果不一致,仅对下一待处理帧目标物的待检测子区域通过重识别模块获得修正后的下一待处理帧目标物的待检测子区域。
优选地,还包括S4.3:通过分析模块仅判断修正后的下一待处理帧目标物的待检测子区域与S3中的目标物的精确子区域id是否一致;如果一致,进行S5,如果不一致,回到S3。
优选地,所述识别结果和所述处理结果包括目标中心位置、识别框、二值图、alpha遮罩图或各个像素的分类概率图。
优选地,所述位置预测包括仿射变换、透视变换、模版匹配、数学形态学操作或根据简单规律增加删除。
优选地,所述识别模块包括图片或视频的目标检测技术、关键点追踪技术、目标分割技术、显著物体分割技术、抠图模块、深度神经网络技术、超像素技术、聚类技术或滤波技术。
优选地,所述方法用于嫁接至现有视频目标检测、识别或分割系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海卫莎网络科技有限公司,未经上海卫莎网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011124541.7/2.html,转载请声明来源钻瓜专利网。