[发明专利]一种基于多子区域图像特征自动学习的车辆检测器训练方法有效
申请号: | 201810053698.1 | 申请日: | 2018-01-19 |
公开(公告)号: | CN108108724B | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 陈卫刚;王勋 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 傅朝栋;张法高 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 区域 图像 特征 自动 学习 车辆 检测器 训练 方法 | ||
1.一种基于多子区域图像特征自动学习的车辆检测器训练方法,其特征在于,该方法包括:
S1:将用于训练的样本图像划分成子区域,取其中若干个子区域的集合表示图像区域,记作:R=(r(x1,y1),r(x2,y2),...,r(xm,ym);w,h),其中R代表图像区域,r(xk,yk)代表所述图像区域中的第k个子区域,(xk,yk)为第k个子区域左上角点的X和Y方向坐标,m为图像区域中子区域的数目,同一个集合中的所有子区域具有相同的宽和高,分别为w和h;
S2:计算图像区域中每个子区域的HOG特征,将子区域按其左上角点位置进行排序,按排序后的次序将各个子区域的HOG连接成一个向量,对连接所得的向量作规范化和降维处理后作为图像区域的特征;
S3:设图像区域共包含M个子区域,取其中的m个子区域构成子区域集合,共有种不同的组合方式,每一种组合方式对应一个弱分类器,以RealBoost算法挑选对于车辆检测具有性能满足预设标准的弱分类器组合成一个强分类器;
S4:多个强分类器以级联的形式构成车辆检测器,其中的每一级对应一个强分类器;
S2中所述计算图像区域中每个子区域的HOG特征,包括:
设Gx和Gy分别为输入图像的X和Y方向的梯度图像,Gx(u,v)和Gy(u,v)分别为像素点(u,v)在输入图像的X和Y方向的梯度强度,按以下公式计算像素(u,v)的梯度强度G(u,v)和梯度方向α(u,v):
α(u,v)=tan-1(Gy(u,v)/Gx(u,v))
所述梯度方向被均匀量化成b个等级,每个子区域的HOG特征是一个包含b个元素的向量,该向量的第i个元素是子区域内具有第i个量化等级所涵盖的梯度方向的所有像素的梯度强度之和;
S2中所述的将各个子区域的HOG连接成一个向量,对连接所得的向量作规范化和降维处理,包括以下步骤:
S21:设有m个子区域,每个子区域的HOG是一个包含b个元素的向量,连接所得的向量记作H,则H包含b×m个元素,按以下公式对H中的每个元素作Min-Max规范化处理:
其中min(H)和max(H)分别代表向量H的最小元素值和最大元素值,H(j)为向量H中的第j个元素;
S22:对每一个弱分类器,根据该弱分类器所规定的子区域组合方式计算各个子区域的HOG,连接各个子区域的HOG且作S21所述Min-Max规范化处理所得到的列向量Hi,按以下公式计算协方差矩阵:
其中Np为正样本数目,μ为对所有正样本计算的均值向量;
S23:求所述协方差矩阵S的本征值,对S的所有本征值按从大到小排序,依次取其中大于阈值的d个本征值λ0、λ1、...、λd-1,取与λi对应的本征向量ci,以c0、c1、...、cd-1作为列向量构成矩阵C,按下式对Hi作降维运算,
Hi=CTHi;
S3中所述的以RealBoost算法挑选对于车辆检测具有性能满足预设标准的弱分类器组合成一个强分类器,包括以下步骤:
S31:t从1到T迭代,其中T是预设的一个强分类器中允许最多包含的弱分类器数目,每轮迭代挑选一个弱分类器;
S32:以训练样本集中的正样本和负样本为输入,分别计算每一个弱分类器的加权误分损失函数,选择具有最小误分损失函数值的弱分类器为最优弱分类器,将其加入到当前的强分类器;
S33:按以下公式更新各个样本的权值,
其中xi代表第i个样本,yi为样本的标记,对应正负样本yi分别为+1和-1,wi为对应样本xi的权值,ft(xi)表示由第t轮迭代选中的最优弱分类器对样本xi进行分类所产生的输出,Z是一个用于归一化的数,按以下公式计算:
S34:使用当前的强分类器对用于测试的样本进行分类,若检测率大于预设的第一阈值且虚警率小于预设的第二阈值,则结束迭代,输出强分类器F(x),否则继续下一次迭代;强分类器F(x)如以下公式所示:
其中sign(·)代表取符号运算,q是一个缺省值为0常数,检测率η和虚警率e分别按以下公式计算:
其中Np是所有正样本数量,Npp是所有正样本中被正确检测的样本数目,Nf是所有负样本数量,Nfp是所有负样本中被错误检测成为正样本的数目;
S32中所述选择具有最小误分损失函数值的最优弱分类器时,其中误分损失函数的计算方法如下:
设待选的弱分类器,按S2所述对其连接所得的向量作规范化和降维处理后形成向量H,将其视作由多个变量组成的多维随机向量H=(h0,h1,...,hd-1),其中d为降维后向量的维数,对每个变量hi,将其取值范围划分成L个区间,其中区间0对应的变量取值范围为hi≤-1,区间L-1对应hi>+1,第n个区间对应变量值的范围为,
其中0<n<L-1;
按以下公式计算落在区间内的训练样本的权值之和:
其中,aj∈[0,L-1]代表L个区间中的一个区间,δ为克罗内克函数,代表训练样本xi对应所述待选的弱分类器经连接、规范化、降维处理所形成的向量,代表向量中的第j个变量,Tr(·)是一个映射函数,若的值落在所述L个区间的第u个区间范围内,则Tr(·)将其映射成u;
对应待选特征的弱分类器为:
其中V(a0,a1,…,ad-1)按以下公式计算:
其中和Pnegative(a0,a1,…,ad-1)分别是由正样本和负样本计算的权值之和;
若有弱分类器对样本xi的分类为误分,则sign(f(xi))≠sign(yi),所述待选的弱分类器对所有样本分类所产生的误分损失函数按以下公式计算,
S4中所述的多个强分类器以级联的形式构成车辆检测器,包括以下步骤:
S41:新训练一个强分类器后,若已有的级联分类器为空,则该强分类器为第0级分类器,若已有的级联分类器已包含了k级分类器,则该强分类器加入到级联分类器的第k+1级;
S42:用新加入一个强分类器的级联分类器对测试图像进行检测,若检测率大于预设第三阈值且误检测率小于预设第四阈值,或者级联分类器的总级数已到达预设的数目,则输出级联分类器,结束训练过程;否则,收集被误分的正样本和负样本,分别加入正、负样本集,且删除负样本集中已被当前训练的强分类器正确检测的负样本,以更新后的正负样本集训练一个新的强分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810053698.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序