[发明专利]多尺度影像目标检测方法、系统、电子设备及存储介质有效
申请号: | 202110408550.7 | 申请日: | 2021-04-16 |
公开(公告)号: | CN112818965B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 洪勇;晏世武;吴培桐;罗书培;李江;张翔 | 申请(专利权)人: | 武汉光谷信息技术股份有限公司;湖北省自然资源厅信息中心 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/46;G06K9/62;G06T7/73;G06T7/80 |
代理公司: | 武汉蓝宝石专利代理事务所(特殊普通合伙) 42242 | 代理人: | 谢洋 |
地址: | 430000 湖北省武汉市东湖新技术*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 尺度 影像 目标 检测 方法 系统 电子设备 存储 介质 | ||
本发明提供一种多尺度影像目标检测方法、系统、电子设备及存储介质,基于小尺度影像训练一个检测模型,利用该检测模型对小尺度影像中的物体目标框进行识别,基于从小尺度影像中识别出的物体目标框,将其映射到大尺度影像中,在大尺度影像中找到同一个物体的目标框,最后利用不同尺度影像对检测模型进行优化,这样不仅增加了检测模型训练集的数据量,还扩展了训练集中影像的尺度,优化后的检测模型适用于识别各种不同尺度影像中的物体目标,提高了目标检测精度。
技术领域
本发明涉及图像处理领域,更具体地,涉及一种多尺度影像目标检测方法、系统、电子设备及存储介质。
背景技术
近年来,随着目标检测领域的不断发展与优化,其检测精度达到了要求,而又随着智慧城市概念的提出,其丰富的信息感知网为目标检测提供了基础平台,并且基于感知网中传感器的不同形成了多视角、多尺度、多分辨率的检测数据。
当前目标检测实现效果最好的方式都是使用深度学习技术实现的,例如Yolov5目标检测,而深度学习技术极大的依赖于数据集量的大小。理论上来说,当其他条件相同时,数据集量越大,其目标检测模型精度越高。但是针对一个工程的目标检测任务,通常都是以视频流的方式来收集数据,其数据集的收集是一个费时且费力的工作,并且针对该工程的目标检测,无法保证能够收集到摄像头多尺度的影像,即无法保证在摄像头焦距变化的情况下影像中物体检测的准确性。
发明内容
本发明提供一种克服上述问题或者至少部分地解决上述问题的一种多尺度影像目标检测方法、系统、电子设备及存储介质。
根据本发明的第一方面,提供了一种多尺度影像目标检测方法,包括:将多个小尺度影像输入预设检测模型,获取所述预设检测模型识别的每一个小尺度影像中的第一物体目标框,所述预设检测模型为根据小尺度影像训练集训练得到;将每一个小尺度影像中的第一物体目标框的像素坐标映射到大尺度影像中,获取大尺度影像中同一个物体的第二物体目标框的像素坐标;基于大尺度影像中的第二物体目标框的像素坐标,利用大尺度影像对所述预设检测模型进行优化,获取优化后的检测模型;基于优化后的检测模型,对任一尺度影像中的物体进行识别;其中,所述小尺度影像为相机拍摄的低倍率影像,所述大尺度影像为相机拍摄的高倍率影像。
在上述技术方案的基础上,本发明还可以进行如下改进。
可选的,通过如下方式训练所述预设检测模型:获取相机拍摄的小尺度视频流,从所述小尺度视频流中提取多帧小尺度影像;对于任一帧小尺度影像,标注其中的物体目标框;基于多帧小尺度影像以及标注的每一帧小尺度影像中的物体目标框,对所述预设检测模型进行训练。
可选的,所述将每一个小尺度影像中的物体目标框的像素坐标映射到大尺度影像中,获取大尺度影像中同一个物体的物体目标框的像素坐标,包括:对于任一个识别出的小尺度影像中的第一物体目标框,提取所述第一物体目标框的像素坐标;基于小尺度影像对应的相机的第一内方位参数和第一外方位参数,将所述第一物体目标框的像素坐标转换到世界坐标系,获取所述第一物体目标框的世界坐标;基于大尺度影像对应的相机的第二内方位参数和第二外方位参数,将所述第一物体目标框的世界坐标转换为对应的像素坐标,获取大尺度影像中的所述第二物体目标框的像素坐标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉光谷信息技术股份有限公司;湖北省自然资源厅信息中心,未经武汉光谷信息技术股份有限公司;湖北省自然资源厅信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110408550.7/2.html,转载请声明来源钻瓜专利网。