[发明专利]车辆和行人检测方法及装置在审
申请号: | 201910033533.2 | 申请日: | 2019-01-14 |
公开(公告)号: | CN110688883A | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 陈睿敏;陈志超;毛河;石永禄 | 申请(专利权)人: | 成都通甲优博科技有限责任公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 11371 北京超凡志成知识产权代理事务所(普通合伙) | 代理人: | 宋南 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 金字塔网络 注意力 加权处理 特征信息 行人检测 训练样本 重叠区域 不均衡 连接层 小目标 漏检 申请 遮挡 尺度 检测 | ||
本申请提供的车辆和行人检测方法及装置,通过特征金字塔网络在多个尺度上提取待识别图像的特征信息获得第一待识别特征;进一步地,通过注意力层对所述第一待识别特征做进一步的处理获得第二待识别特征;进一步地,通过全连接层对所述第二待识别特征进行处理识别出所述待识别图像中的车辆和行人,并对该车辆和行人进行标记。本申请公开的技术方案通过特征金字塔网络有效的降低了对待识别图像中远处小目标的漏检,通过注意力层降低了待识别图像中遮挡或者重叠区域对识别效果的影响。并通过对训练样本进行加权处理,降低了类别不均衡对检测精度的影响。
技术领域
本申请涉及图像识别领域,具体而言,涉及一种车辆和行人检测方法及装置。
背景技术
目前的高速公路车辆行人检测,很多是基于监控摄像头的图像进行的,此摄像机的分辨率低,色域窄,远距离的车辆非常模糊,特征有限。现有常用方法有以下缺点:(1)有效检测距离近,因为高速公路没有很多遮挡物,视野比较远,所以对远距离小目标的检测有很高要求。(2)在增大有效检测距离的同时,会造成算法速度的大幅提升,难以满足实时性。(3)在有限的计算资源和较高的需求下,高误检率和高漏检率难以避免。(4)人的检测容易对车辆检测造成不良影响。
发明内容
为了克服现有技术中的上述不足,本申请的目的在于提供一种车辆和行人检测方法,应用于图像处理设备,所述图像处理设备预设有神经网络模型,所述神经网络模型包括特征金字塔网络、注意力层和全连接层,所述方法包括:
获取待识别图像;
通过所述特征金字塔网络学习所述待识别图像获得第一待识别特征;
通过所述注意力层学习所述第一待识别特征获得第二待识别特征,所述注意力层用于关注待识别图像的特定区域;
通过所述全连接层学习所述第二待识别特征获得所述待识别图像中目标的分类概率和所述目标的位置信息。
可选地,所述方法还包括:
根据所述分类概率和所述目标的位置信息获得多个方框,所述方框用于标记所述图像中的所述目标,所述方框包括有对应的置信分数,所述置信分数表示所述目标的分类概率;
针对所述方框中大于第一预设IOU(IOU,Intersection over Union)阀值的方框,根据所述大于第一预设IOU阀值的方框的置信分数,调整所述大于第一预设IOU阀值的方框的置信分数,其中调整后的置信分数大于零;
根据第二预设IOU阈值从所述多个方框中选取所述目标的多个候选框,并根据所述候选框的置信分数获得所述候选框对应的权值;
根据所述多个候选框的置信分数和所述候选框对应的权值,通过加权平均算法获得所述目标的目标候选框。
可选地,所述特征金字塔网络包括至少一层初始卷积层和特征金字塔,所述特征金字塔包括至少一个第一特征金字塔和至少一个第二特征金字塔,所述第一特征金字塔包括多个层级不同的卷积层,所述第二特征金字塔包括与所述多个层级不同的卷积层对应的多个反卷积层;其中,所述特征金字塔网络的第一个特征金字塔为第一特征金字塔,所述第一特征金字塔的输出作为所述第二特征金字塔的输入,所述第二特征金字塔的输出作为所述第一特征金字塔的输入;所述通过所述特征金字塔网络学习所述待识别图像获得第一待识别特征的步骤包括:
通过所述初始卷积层学习所述待识别图像获得初始特征图;
依次通过所述第一特征金字塔和所述第二特征金字塔学习所述初始特征图,将所述特征金字塔网络中最后一个特征金字塔每一层的输出作为所述第一待识别特征,其中,所述第一特征金字塔的每一个卷积层的输出和该卷积层对应的上一个第二特征金字塔的反卷积层的输入相融合;所述第二特征金字塔网络的每一个反卷积层输出和该反卷积层对应的上一个第一特征金字塔的卷积层的输入相融合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都通甲优博科技有限责任公司,未经成都通甲优博科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910033533.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:针对印刷字体的ocr中字体分割错误的纠正方法
- 下一篇:客流统计方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序