[发明专利]一种基于kmeans的高效车辆检测方法有效
申请号: | 201710679052.X | 申请日: | 2017-08-10 |
公开(公告)号: | CN107392176B | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 邝沛江;李梦涵;周智恒;李波 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06K9/66 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 许菲菲 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 kmeans 高效 车辆 检测 方法 | ||
1.一种基于kmeans的高效车辆检测方法,其特征在于,包括以下步骤:
S1、离线学习;
S2、在线检测;
所述步骤S1包括以下步骤:
S1.1、从标记了车辆的自然图像中采集正负训练样本,并进行正负训练样本预处理,构成正样本集合P和负样本集合N;
S1.2、计算并记录正样本集合P中每个正样本的信息熵,形成正样本集合的信息熵分布;
S1.3、计算并记录负样本集合N中每个负样本的信息熵,形成负样本集合的信息熵分布;
S1.4、根据步骤S1.2和步骤S1.3得到的两个信息熵分布,确定信息熵阈值T;
S1.5、假设正样本集合P的大小为MP,采取有放回的抽样方法从正样本集合P中抽取K个子集合P1,P2,...,PK,每个子集合的元素个数为MP;
S1.6、假设负样本集合N的大小为MN,采取有放回的抽样方法从负样本集合N中抽取K个子集合N1,N2,...,NK,每个子集合的元素个数为MN;
S1.7、将步骤S1.5和步骤S1.6得到正样本集合P1,P2,...,PK和负样本N1,N2,...NK中每个样本进行kmeans特征提取,得到新的正样本集合P1’,P2’,...,PK’和新的负样本集合N1’,N2’,...,NK’,新的正样本集合和新的负样本集合形成K个包含正负训练样本的集合U={U1,U2,...,UK};
S1.8、利用步骤S1.7得到的集合U中的每个训练集构建一棵决策树,并记录其准确率,最终得到K棵决策树F={f1,f2,...,fK}以及相应的准确率A={a1,a2,...,aK};
所述步骤S2包括以下步骤:
S2.1、假设候选物集合为S,将S初始化为空集;
S2.2、初始化滑动窗口的起点为图像左上顶点,滑动窗口的宽w为图像的宽的1/10,滑动窗口的高h为图像的高的1/10;
S2.3、计算滑动窗口对应的图像区域的信息熵H;
S2.4、将步骤S2.3得到信息熵H与步骤S1.4得到的信息熵阈值T做比较,若HT,则记此滑动窗口为候选物,记为s=(x,y,w,h),其中x,y为滑动窗口的左上顶点的坐标,w,h分别为滑动窗口的宽和高,将候选物s=(x,y,w,h)加入候选物集合S中;
S2.5、移动滑动窗口一个步长,重复步骤S2.3~S2.4直到滑动窗口完成遍历图像;
S2.6、调整滑动窗口的宽和高,重复步骤S2.2~S2.5直到完成遍历所有预设定的宽和高,预设定的宽为图像宽的9/10,预设定的高为图像高的9/10;
所述的移动一个步长的方法具体为:
假设滑动窗口W={xi,yi,wi,hi},当滑动窗口向右移动时,步长取0.5×wi,当滑动窗口向下移动时,步长取0.5×hi;
S2.7、经过步骤S2.1~S2.6后得到候选物集合S,利用步骤S1.8得到的K棵决策树F对候选物集合S中每一个候选物进行预测分类,若预测分类分类结果为车辆,则将此候选物s=(x,y,w,h)在图像中进行画框标记;
在步骤S1.1中,所述从标记了车辆的自然图像中采集正负训练样本的方法具体为:
自然图像I中标记了所有车辆的位置,每辆车辆记为vi=(xi,yi,wi,hi),其中,xi,yi为车辆位置框的左上顶点,wi,hi为车辆位置框的宽和高,利用滑动窗口W=(xj,yj,wj,hj)扫描自然图像I,如果滑动窗口与车辆位置框vi=(xi,yi,wi,hi)重叠超过70%,则该滑动窗口对应的图像区域为正样本,否则为负样本。
2.根据权利要求1所述的基于kmeans的高效车辆检测方法,其特征在于,步骤S1.1所述的正负训练样本图像预处理的具体方法为:
图像归一化处理:将每个样本图像其尺寸缩放之16×16×3,每个样本图像减去自身的均值并除以图像自身的标准差;
特征维度白化处理:每个样本图像进行完图像归一化处理之后,将每个样本图像拉成一行向量(1×768),训练集中样本图像的每一个维度减去样本训练集中该维度的均值形成新的训练集,计算新的训练集的特征向量V和特征值对角阵D,得到白化矩阵
新的训练集即矩阵右乘白化矩阵B完成特征维度白化处理;其中,ε=0.05;
步骤S1.2和步骤S1.3所述的信息熵计算方法具体为:
将RGB图像进行灰度化,得到图像的灰度分布直方图,则图像的信息熵为:
H=-∑p(i)logp(i),
其中,i表示灰度值,p(i)表示灰度分布直方图中灰度值的概率;
步骤S1.4所述的确定信息熵阈值T的方法具体为:
假设正样本集合P的信息熵分布包络线为QP,负样本集合N的信息熵分布包络线为QN,令QP=QN,则可得信息熵阈值T;
步骤S1.7所述的kmeans特征提取的方法具体为:
从步骤S1.5的正样本集合P中利用Kmeans方法聚类形成800个类中心,记为c={c1,c2,...,c800};对正样本集合Pi和负样本集合Ni中的每一个样本进行特征提取:
fk(x)=max{0,μ(z)-zk},
其中fk(x),表示样本x的特征的第k维,zk表示样本x到第k个聚类中心的欧式距离,μ(z)表示样本到各个聚类中心的平均距离;
步骤S2.7所述的调整滑动窗口的宽和高方法具体为:
第i次调整滑动窗口的宽为:
wi=(1+αi)wi-1,
第i次调整滑动窗口的高为:
hi=(1+βi)hi-1,
其中
步骤S2.8所述的利用K棵决策树F对候选物进行预测分类的方法具体为:
取候选物集合中的一个候选物s={x,y,w,h},将其对应的图像块缩放至16×16×3,然后拉成一行向量1×768,将此行向量右乘白化矩阵B,将候选物对应的图像块进行特征维度白化操作;每棵决策树对白化处理后的图像块进行分类,得到类标li∈{-1,1},其中li=-1,表示负样本,li=1表示正样本;最终图像块的类标:
l=sgn(∑(1-ai)li),
其中l∈{1,-1}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710679052.X/1.html,转载请声明来源钻瓜专利网。