[发明专利]识别目标数量的方法、装置及计算机可读存储介质有效
| 申请号: | 201810733440.6 | 申请日: | 2018-07-06 |
| 公开(公告)号: | CN108921105B | 公开(公告)日: | 2020-11-03 |
| 发明(设计)人: | 刘明;王怀庆;付靖玲 | 申请(专利权)人: | 京东数字科技控股有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 姜雍;方亮 |
| 地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 识别 目标 数量 方法 装置 计算机 可读 存储 介质 | ||
1.一种识别目标数量的方法,包括:
采用深度学习神经网络对待预测图像进行处理,得到具有待预测图像的浅层图像特征以及深层图像特征的目标点云图像,所述目标点云图像中的每个目标点代表待预测图像中的一个目标;所述深度学习神经网络包括卷积层和反卷积层,其中的反卷积层被配置为对卷积层输出的图像特征进行反卷积操作并叠加至卷积层输出的图像特征;所述深度学习神经网络包括VGG16网络模型的前五个卷积块与附加的第一反卷积层、第二反卷积层、第三反卷积层;所述第一反卷积层被配置为对第五个卷积块输出的图像特征进行反卷积操作并叠加至第四个卷积块输出的图像特征;所述第二反卷积层被配置为对第一次叠加输出的图像特征进行反卷积操作并叠加至第三个卷积块输出的图像特征;所述第三反卷积层被配置为对第二次叠加输出的图像特征进行反卷机操作并叠加至第二个卷积块输出的图像特征;所述深度学习神经网络还包括附加的卷积层,所述附加的卷积层被配置为对第三次叠加输出的图像特征进行处理,得到平滑的目标点云灰度图像;
对所述目标点云图像中的点云数量进行识别,得到待预测图像中的目标数量。
2.如权利要求1所述的方法,其中,所述方法还包括:
将所述第一反卷积层、第二反卷积层、第三反卷积层的通道数设置为256;
在第一次叠加操作之前,采用1×1的卷积操作将第五个卷积块输出的图像特征的通道数处理为256;
在第二次叠加操作之前,采用1×1的卷积操作将第四个卷积块输出的图像特征的通道数处理为256;
在第三次叠加操作之前,采用1×1的卷积操作将第三个卷积块输出的图像特征的通道数处理为256。
3.如权利要求1所述的方法,所述方法还包括:
对训练图像中的各个目标进行打点操作;
利用训练图像以及打点后的训练图像对所述深度学习神经网络进行训练,使得所述深度学习神经网络能够将待预测图像处理为具有待预测图像的浅层图像特征以及深层图像特征的目标点云图像,所述目标点云图像中的每个目标点代表待预测图像中的一个目标。
4.如权利要求3所述的方法,其中,
对训练图像中的各个目标进行打点操作后进行高斯模糊处理;
利用训练图像以及高斯模糊处理后的训练图像对所述深度学习神经网络进行训练。
5.如权利要求4所述的方法,所述对训练图像中的各个目标进行打点操作包括:
对训练图像中的各个目标在不同目标部位进行打点操作,并使得将代表第一目标的目标点扩大至周围八个像素点后仍然位于所述第一目标上。
6.如权利要求1所述的方法,所述方法还包括:
采用摄像机对待识别目标群进行录像,得到待识别目标群的视频;
从所述视频中截取视频图像,采用如权利要求1中的步骤实时识别视频图像中的目标数量。
7.如权利要求6所述的方法,其中,所述摄像机的个数为多个,所述摄像机的分辨率与所述摄像机录像环境的光照强度呈负相关,所述摄像机的广角与随所述摄像机的架设位置变化而变化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股有限公司,未经京东数字科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810733440.6/1.html,转载请声明来源钻瓜专利网。





