[发明专利]一种图像中物体检测方法、装置、存储介质及终端在审
申请号: | 202110797281.8 | 申请日: | 2021-07-14 |
公开(公告)号: | CN113537342A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 廖丹萍 | 申请(专利权)人: | 浙江智慧视频安防创新中心有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 李小朋 |
地址: | 311215 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 物体 检测 方法 装置 存储 介质 终端 | ||
本发明公开了一种图像中物体检测方法、装置、存储介质及终端,方法包括:获取待检测的目标图像;将待检测的目标图像输入预先训练的物体检测模型中;其中,预先训练的物体检测模型的损失函数是根据图像数据中物体的长宽比值确定出权重值后加权生成的;输出目标图像中各物体的位置与多个类别概率值;根据多个类别概率值确定出各物体的最终类别。因此,由于本申请通过物体的长宽比值来确定权重值,并采用该权重值增加大长宽比例物体的损失函数的权重,使得模型对大长宽比例的物体的具有更大的损失,从而提升了模型对长宽比例较大物体的检测性能。
技术领域
本发明涉及计算机视觉技术领域,特别涉及一种图像中物体检测方法、装置、存储介质及终端。
背景技术
图像中物体检测是计算机视觉和数字图像处理的重要研究方向,广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域。图像中物体检测的目标是找出图像中感兴趣的对象,包含物体定位和物体分类两个子任务,即同时确定物体的类别和位置。
在现有技术中,利用神经网络结合大量图片数据进行训练的物体检测模型已经成为行业的主流模型训练方式。基于神经网络的算法基本上可以归为两类:以Faster R-CNN为代表的两阶段算法和以YOLO、SSD等为代表的一阶段算法。不论是一阶段算法或者两阶段算法,对于检测长宽比例大于一定值的长条形物体,例如滑雪板,铅笔,等,相比检测长宽比较小的物体,如足球、汽车等,性能有很大程度的下降。一些情况中网络不能检测出长宽比例大于一定值的物体,另一些情况中虽然网络可以检测出长宽比例大于一定值的物体,但是物体位置不够准确。
导致这个现象的原因之一是由于长宽比大于一定值的物体占整个数据集包含的目标的比重较小。训练模型时,模型未将长宽比例大于一定值的物体作为优化重点,导致模型不能很好地学习到长宽比例大于一定值的物体的特征,进而无法对图像中的长宽比例大于一定值的物体进行正确分类,或者无法准确定位其位置。
发明内容
本申请实施例提供了一种图像中物体检测方法、装置、存储介质及终端。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
第一方面,本申请实施例提供了一种图像中物体检测方法,方法包括:
获取待检测的目标图像;
将待检测的目标图像输入预先训练的物体检测模型中;其中,预先训练的物体检测模型的损失函数是根据图像数据中物体的长宽比值确定出权重值后加权生成的;
输出目标图像中各物体的位置与多个类别概率值;
根据多个类别概率值确定出各物体的最终类别。
可选的,按照下述步骤生成预先训练的物体检测模型,包括:
采集包含多种物体的图像生成模型训练样本;
创建物体检测模型;
从模型训练样本中获取第n图像输入物体检测模型中,输出图像中每个物体的第一位置信息与第一类别信息;
构建第n图像中的目标标签;其中,目标标签包括第二位置信息和第二类别信息;
根据第二位置信息确定损失函数的权重值;
根据第一位置信息与第一类别信息、第二位置信息和第二类别信息、权重值构建物体检测模型的损失函数;
将第一位置信息与第一类别信息输入物体检测模型的损失函数中,输出模型的损失值;
基于损失值优化物体检测模型,生成训练后的物体检测模型;
将训练后的物体检测模型确定为预先训练的物体检测模型。
可选的,预先训练的物体检测模型包括特征提取模块、分类模块与回归模块;
从模型训练样本中获取第n图像输入物体检测模型中,输出图像中每个物体的第一位置信息与第一类别信息,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江智慧视频安防创新中心有限公司,未经浙江智慧视频安防创新中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110797281.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序