[发明专利]一种城市行人检测方法在审
| 申请号: | 201810696570.7 | 申请日: | 2018-06-29 |
| 公开(公告)号: | CN109117717A | 公开(公告)日: | 2019-01-01 |
| 发明(设计)人: | 杨军 | 申请(专利权)人: | 广州烽火众智数字技术有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京和信华成知识产权代理事务所(普通合伙) 11390 | 代理人: | 胡剑辉 |
| 地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 行人检测 特征图 原始图像 整体特征 图像 非极大值抑制 图像处理模块 图像特征获取 单一特征 放大图像 分类网络 候选窗口 检测结果 局部特征 模块接收 配合检测 神经网络 特征图像 依次连接 误判 分类器 检测 后框 漏检 加权 标注 尺度 出行 分类 | ||
1.一种城市行人检测方法,其特征在于,包括以下步骤:
S1、通过安装于城市道路旁的摄像头采集行人图像,并将采集的图像上传,通过图像特征获取模块接收原始图像;
S2、将接收的原始图像通过图像处理模块进行处理,并提取其中的局部特征,进行放大,其中,所述图像特征图(或者叫地标图)是指利用参数化特征(如点和线)的全局位置来表示环境;
S3、特征图扩展:通过图像幂率规则和图像特征金字塔规则计算图像临近规模对应的特征图;
S4、将所述整体特征图像和所述局部特征放大图像依次连接,并将整体特征图像和所述局部特征放大图像输送到特征数据库模块进行比对;
S5、分类网络训练:利用多种尺度行人在不同特征图中的的分布训练深度神经网络;
S6、行人检测标注:将得到的两种规模特征图的候选窗口数目按比例汇总,经过S5中训练好的分类器分类,经过非极大值抑制后框出行人;
S7、检测结果显示。
2.根据权利要求1所述的一种城市行人检测方法,其特征在于,所述S2中将接收的图像进行提取放大的步骤为:从整体特征图像中,扫面选取行人的明显特征,并通过放大,清晰的处理,将局部特征显现处理,并进行保存。
3.根据权利要求1所述的一种城市行人检测方法,其特征在于,所述S3中扩展的图片规模和扩展次数不设限。
4.根据权利要求1所述的一种城市行人检测方法,其特征在于,所述S3中对特征图扩展的步骤为:通过图像幂率规则和图像特征金字塔规则计算图像I1临近规模对应的特征图,一般利用fm=Cp(S(I1,M)),式中I1代表原图像,M代表缩放规模,S代表将原图缩放,Cp代表卷积池化操作计算特征,现在为减少卷积运算提高运行速度,利用公式:
其中:参数m表示当前规模,m′表示缩放后的规模,S代表将特征图缩放m′/m倍,f表示特征,常系数α可以在训练集上通过实验测得,以上公式表明原图Im通过卷积池化操作得到特征,临近缩放规模图像特征由已知特征图近似计算得到,如1/2*I1可以计算得到f1/2,因为图像上采样没有高频损失,上采样图片的信息内容与低分辨率的内容相似,特征计算公式为:
fσ=σ*S(f1,σ)) (3.2)
式中f1代表原图对应特征图,S代表将特征图f1放大σ倍,fσ为上采样图像。
5.根据权利要求1所述的一种城市行人检测方法,其特征在于,所述S5中对分类网络训练包括:选择在有多种行人尺度的KITTI数据集上实验,我们在训练数据集上将行人按高度分为X个尺寸的行人。
6.根据权利要求5所述的一种城市行人检测方法,其特征在于,利用卷积层特征共享训练RPN(region proposal network)网络和softmax分类器联合网络,采用交叉轮流训练的方式,先训练区域提议网络(R P N),再用提议(proposal)训练基于区域的分类器网络,再用分类器网络训练区域提议网络,损失层(losslayer)是卷积神经网络(CNN)的终点,接受两个值作为输入,其中一个是CNN的预测值,另一个是真实标签。
7.根据权利要求6所述的一种城市行人检测方法,其特征在于,所述损失层则将这两个输入进行一系列运算,得到当前网络的损失函数(LossFunction),一般记做L(W),其中W是当前网络权值构成的向量空间,训练网络的目的是在权值空间中找到让损失函数L(W)最小的权值W(opt),可以采用随机梯度下降(stochasticgradient descent)的最优化方法逼近权值W(opt),网络中有两个损失函数,一个是分类损失函数一个是回归损失函数。
8.根据权利要求1所述的一种城市行人检测方法,其特征在于,所述S6中对行人检测标注的步骤为:每个规模的候选行人分别与S5中训练得到的权重1x相乘,通过非极大值抑制,除去与最大置信度窗口重叠超过65%的窗口。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州烽火众智数字技术有限公司,未经广州烽火众智数字技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810696570.7/1.html,转载请声明来源钻瓜专利网。





