[发明专利]一种构建行人检测模型的方法有效
| 申请号: | 201910377894.9 | 申请日: | 2019-05-07 |
| 公开(公告)号: | CN110070074B | 公开(公告)日: | 2022-06-14 |
| 发明(设计)人: | 王兵;卢琨;周郁明;王彦;程木田;陈鹏 | 申请(专利权)人: | 安徽工业大学 |
| 主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V40/16;G06V20/52;G06V10/762;G06V10/774;G06V10/82;G06K9/62 |
| 代理公司: | 北京睿智保诚专利代理事务所(普通合伙) 11732 | 代理人: | 周新楣 |
| 地址: | 243002 *** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 构建 行人 检测 模型 方法 | ||
1.一种构建行人检测模型的方法,其特征在于,先从数据库中随机选取行人图像并对行人图像的头部进行标注作为标签文件,再将选取的行人图像划分为训练集、测试集和验证集;而后对训练集进行聚类分析得到新的先验框,利用k-means对训练集进行聚类分析得到新的先验框数目和纬度;聚类分析的具体步骤为:
1)计算距离
计算距离的公式为:
d(box,centroid)=1-IOU(box,centroid)
式中,centroid表示簇中心框,box表示聚类框,IOU(box,centroid)表示簇中心框与聚类框的交并比:
2)聚类选值
利用聚类目标函数计算先验框的数量,聚类目标函数的公式为:
式中,B表示标注原始框,k表示先验框的个数,1≤k≤9;IOU(box,B)表示聚类框与标注原始框的交并比:通过聚类目标函数计算k取值为1~9时对应的目标函数值S,而后得到折线图,根据折线图中曲线的变化趋势,寻找拐点得到k值;
3)获得先验框
利用聚类目标函数对每个标注框与聚类中心之间的距离进行计算,将标注框移动到距离最近的某个簇的聚类中心;再对每个簇的聚类中心点进行计算,计算公式如下:
式中,Ni表示的是第i个簇中包含的标注框个数,wi表示聚类中心点的横坐标,hi表示聚类中心点的纵坐标;Wi'表示先验框的宽度,Hi'表示先验框的高度;
重复步骤3)直到聚类中心的位置不变,其中位于聚类中心的边框为最终要求的先验框;
再对YOLOv3网络进行网络结构调整;具体地,删除YOLOv3网络结构中用于检测大型目标的yolo层,同时将获得的先验框数目和维度输入到yolo层中,并对yolo层卷积层的卷积核数目进行精简;然后利用YOLOv3网络对训练集进行训练得到行人检测模型,再利用验证集对行人检测模型进行评估,最后利用测试集对行人检测模型进行测试;利用验证集对行人检测模型进行评估的具体步骤为:根据训练损失值与验证损失值判断网络训练的状态,若训练损失值和验证损失值随着迭代次数的增加不断下降,则表示网络训练正常,否则表示网络训练异常;
其中,损失值由损失函数计算获得,损失函数采用联合优化的方式,分别对物体的中心点坐标(x,y)、先验框长度和宽度的回归值(w,h)、置信度confidence以及类别class进行优化,其计算公式为:
loss=xyloss+whloss+confidenceloss+classloss。
2.根据权利要求1所述的一种构建行人检测模型的方法,其特征在于,利用测试集测试行人检测模型的准确率和召回率,其中准确率的计算公式为:
召回率的计算公式为:
其中,P表示准确率,TP表示行人检测模型将包含行人的窗口预测为是的数量,FP表示行人检测模型将不包含行人的窗口预测为是的数量,FN表示行人检测模型将包含行人的窗口预测为否的数量。
3.根据权利要求1所述的一种构建行人检测模型的方法,其特征在于,当网络训练异常时,根据训练损失值与验证损失值随着网络迭代次数的变化情况,调整行人检测模型的配置并重新进行网络训练。
4.根据权利要求1~3任一项所述的一种构建行人检测模型的方法,其特征在于,网络训练的初始参数设置为:学习率为0.01,批处理样本为64,最大迭代次数为15000次。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽工业大学,未经安徽工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910377894.9/1.html,转载请声明来源钻瓜专利网。





