[发明专利]车辆和行人检测方法及装置在审
申请号: | 201910033533.2 | 申请日: | 2019-01-14 |
公开(公告)号: | CN110688883A | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 陈睿敏;陈志超;毛河;石永禄 | 申请(专利权)人: | 成都通甲优博科技有限责任公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 11371 北京超凡志成知识产权代理事务所(普通合伙) | 代理人: | 宋南 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 金字塔网络 注意力 加权处理 特征信息 行人检测 训练样本 重叠区域 不均衡 连接层 小目标 漏检 申请 遮挡 尺度 检测 | ||
1.一种车辆和行人检测方法,其特征在于,应用于图像处理设备,所述图像处理设备预设有神经网络模型,所述神经网络模型包括特征金字塔网络、注意力层和全连接层,所述方法包括:
获取待识别图像;
通过所述特征金字塔网络学习所述待识别图像获得第一待识别特征;
通过所述注意力层学习所述第一待识别特征获得第二待识别特征,所述注意力层用于关注待识别图像的特定区域;
通过所述全连接层学习所述第二待识别特征获得所述待识别图像中目标的分类概率和所述目标的位置信息。
2.根据权利要求1所述的车辆和行人检测方法,其特征在于,所述方法还包括:
根据所述分类概率和所述目标的位置信息获得多个方框,所述方框用于标记所述图像中的所述目标,所述方框包括有对应的置信分数,所述置信分数表示所述目标的分类概率;
针对所述方框中大于第一预设IOU阀值的方框,根据所述大于第一预设IOU阀值的方框的置信分数,调整所述大于第一预设IOU阀值的方框的置信分数,其中调整后的置信分数大于零;
根据第二预设IOU阈值从所述多个方框中选取所述目标的多个候选框,并根据所述候选框的置信分数获得所述候选框对应的权值;
根据所述多个候选框的置信分数和所述候选框对应的权值,通过加权平均算法获得所述目标的目标候选框。
3.根据权利要求1所述的车辆和行人检测方法,其特征在于,所述特征金字塔网络包括至少一层初始卷积层和特征金字塔,所述特征金字塔包括至少一个第一特征金字塔和至少一个第二特征金字塔,所述第一特征金字塔包括多个层级不同的卷积层,所述第二特征金字塔包括与所述多个层级不同的卷积层对应的多个反卷积层;其中,所述特征金字塔网络的第一个特征金字塔为第一特征金字塔,所述第一特征金字塔的输出作为所述第二特征金字塔的输入,所述第二特征金字塔的输出作为所述第一特征金字塔的输入;所述通过所述特征金字塔网络学习所述待识别图像获得第一待识别特征的步骤包括:
通过所述初始卷积层学习所述待识别图像获得初始特征图;
依次通过所述第一特征金字塔和所述第二特征金字塔学习所述初始特征图,将所述特征金字塔网络中最后一个特征金字塔每一层的输出作为所述第一待识别特征,其中,所述第一特征金字塔的每一个卷积层的输出和该卷积层对应的上一个第二特征金字塔的反卷积层的输入相融合;所述第二特征金字塔网络的每一个反卷积层输出和该反卷积层对应的上一个第一特征金字塔的卷积层的输入相融合。
4.根据权利要求3所述的车辆和行人检测方法,其特征在于,所述特征金字塔网络包括2个第一特征金字塔和1个第二特征金字塔。
5.根据权利要求1所述的车辆和行人检测方法,其特征在于,所述注意力层包括卷积层和激活函数,所述通过所述注意力层学习所述第一待识别特征获得第二待识别特征的步骤包括:
通过所述注意力层的卷积层学习所述第一待识别特征获得第一注意力特征;
通过所述激活函数对所述第一注意力特征进行处理获得第二注意力特征;
将所述第二注意力特征和所述第一待识别特征的数据相融合获得所述第二待识别特征。
6.根据权利要求1所述的车辆和行人检测方法,其特征在于,所述方法还包括对所述神经网络模型的训练步骤:
获取样本集,按照预设比例将所述样本集分为训练样本和验证样本,并通过预设参数初始化所述神经网络模型;
通过带权采样的方式从所述训练样本中获得多个预设数量的小批量样本,其中,所述小批量样本中出现的行人数量总和与出现的车辆数量的总和之间的比例为预设比例值;
将所述多个预设数量的小批量样本依次送入所述神经网络模型,计算所述训练样本的误差,然后通过反向传播算法修改所述神经网络模型中的权值,直至所述训练样本的误差在预设的范围内;
将所述验证样本输入经所述训练样本训练后的神经网络模型进行学习,进一步地修正经所述训练样本训练后的神经网络模型的权值,获取识别所述验证样本的误差、准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都通甲优博科技有限责任公司,未经成都通甲优博科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910033533.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:针对印刷字体的ocr中字体分割错误的纠正方法
- 下一篇:客流统计方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序