[发明专利]一种级联回归目标检测方法、装置及计算机可读存储介质在审
| 申请号: | 202111092255.1 | 申请日: | 2021-09-17 |
| 公开(公告)号: | CN114241250A | 公开(公告)日: | 2022-03-25 |
| 发明(设计)人: | 张可;袁堃;葛绍妹;邓其龙;杨俊;高昱峰 | 申请(专利权)人: | 国网电力科学研究院有限公司;安徽南瑞继远电网技术有限公司;国网浙江省电力有限公司杭州供电公司 |
| 主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/80;G06V10/25;G06V10/44;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 杭州华鼎知识产权代理事务所(普通合伙) 33217 | 代理人: | 魏亮 |
| 地址: | 210000 江苏省南*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 级联 回归 目标 检测 方法 装置 计算机 可读 存储 介质 | ||
本发明公开了一种级联回归目标检测方法、装置及计算机可读存储介质,方法包括以下步骤:获取待检测图片,进行像素的标准化并缩放至相同大小;将调整后的待检测图片输入至训练好的深度卷积神经网络模型中,所述深度卷积神经网络模型由带有标注信息的训练图片训练得到,且包括用于特征提取的骨干网络、用于分步调整预设框的级联的区域建议模块、用于微调预设框的级联的两路回归器模块、用于优化上述模块的距离损失函数和损失函数。本发明通过级联回归的思想改善双阶段目标检测器的性能,在保持较高检测精度的同时,降低算法的检测时间。
技术领域
本发明涉及图像识别领域,特别涉及一种级联回归目标检测方法、装置及计算机可读存储介质。
背景技术
近年来,随着计算机运算性能的提升,人工智能的发展不但取得了长足的进步,而且在各行各业逐渐呈现出规模化应用的现象。计算机视觉作为人工智能重要的研究领域之一,对生产和生活方式的革新有巨大的推动作用。例如代表未来出行方式的无人驾驶汽车,提高工厂生产效率的智能制造,事前预警的智能安防等等,计算机视觉都是它们得以实现的技术基础。
图像分类中,目标检测、语义分割以及实例分割是计算机视觉领域三个基础的视觉识别任务。目标检测不仅仅要识别目标类别,而且也需要利用矩形框预测出目标的位置,目标检测是许多场景必须要采用的基础模块,例如人脸识别,行人检测,视频分析和标志检测等。语义分割为每一个像素分配具体的类别标签,从而提供信息更加丰富的图像描述,不同于目标检测,语义分割对相同类别的多个目标不进行区分。实例分割是目标检测和语义分割的结合体,需要去识别不同的物体,并且为每一个物体分配逐像素的类别掩码。实际上,实例分割可以被认为是目标检测的一个特例,它不使用矩形框定位一个目标,而是使用逐像素的定位。
目标检测算法通常分为双阶段算法和单阶段算法。双阶段的目标检测器通常由两部分组成,首先是候选区域生成器,在生成候选区域的过程中,生成器尝试去寻找图像中可能存在目标的区域,主要的目的是发现召回率较高的区域,使得图像中所有的物体尽可能的和一个候选区域匹配;然后是对候选区域进行分类和回归的检测器。双阶段目标检测器具有检测精度高的优势,但是往往不能满足实时检测的需求。
单阶段的目标检测器通常在架构上较为简单,不同于双阶段的目标检测算法将检测流程划分为候选框生成和区域分类两个阶段,它将特征图上的每一个像素都认为有可能存在目标物体,并且尝试为该像素分别分配矩形框和多个置信度来确定物体的准确位置和概率值。单阶段目标检测器有着较高的检测速度,但是往往伴随着较差的检测精度。
一般情况下精度需求大于速度需求,因此双阶段的目标检测算法适用性更广。但现有双阶段目标检测算法的不足之处在于,性能较高的算法往往需要耗费的算力资源和检测时间都较高,难以满足实际要求。因此急需一种轻量级高性能的双阶段目标检测方法。
发明内容
针对现有技术检测性能不佳的问题,本发明提供了一种级联回归目标检测方法、装置及计算机可读存储介质,通过级联回归的思想改善双阶段目标检测器的性能,在保持较高检测精度的同时,降低算法的检测时间。
以下是本发明的技术方案。
一种级联回归目标检测方法,包括以下步骤:
获取待检测图片,进行像素的标准化并缩放至相同大小;
将调整后的待检测图片输入至训练好的深度卷积神经网络模型中,所述深度卷积神经网络模型由带有标注信息的训练图片训练得到,且包括用于特征提取的骨干网络、用于分步调整预设框的级联的区域建议模块、用于微调预设框的级联的两路回归器模块、用于优化上述模块的距离损失函数和损失函数;
利用训练好的深度卷积神经网络模型对待检测图片进行检测,得到检测结果。
作为优选,所述骨干网络通过若干分辨率不同的特征预测层对图片进行特征提取;所述骨干网络包括ResNet系列网络或VGG系列网络中的一种,以及在此基础上添加的额外卷积网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网电力科学研究院有限公司;安徽南瑞继远电网技术有限公司;国网浙江省电力有限公司杭州供电公司,未经国网电力科学研究院有限公司;安徽南瑞继远电网技术有限公司;国网浙江省电力有限公司杭州供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111092255.1/2.html,转载请声明来源钻瓜专利网。





