[发明专利]基于深度学习的路面遗撒识别方法在审
申请号: | 201810592958.2 | 申请日: | 2018-06-11 |
公开(公告)号: | CN109033947A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 刘佳辰;魏旭;李峰;叶紫欣;李建康;汤子湘;周思齐;王瑶;伍翌嘉 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京航智知识产权代理事务所(普通合伙) 11668 | 代理人: | 程连贞;陈磊 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据集 自制 改进 道路巡检 类别概率 模型输入 实时识别 训练步骤 包围框 卷积核 特征层 准确率 减小 采集 学习 优化 图片 | ||
1.一种基于深度学习的路面遗撒识别方法,其特征在于,包括以下步骤:
步骤一:采集路面遗撒数据,构造自制数据集;
步骤二:通过减小卷积核大小和增加不同特征层之间的连接,建立改进的YOLO模型;
步骤三:使用步骤一中构造的自制数据集训练步骤二中建立的改进的YOLO模型;
步骤四:将经过训练的改进YOLO模型输入待测图片,计算求得目标的类别概率和包围框,以识别路面遗撒。
2.根据权利要求1所述的基于深度学习的路面遗撒识别方法,其特征在于,所述步骤二中的减小卷积核大小具体为:采用1x1卷积核,增加网络层数,使得前部的卷积层在不增加参数数量的同时可以获得更小范围的卷积核,后部的卷积层在这个基础上形成从边缘、形状、部分、物体的层级特征结构。
3.根据权利要求1或2所述的基于深度学习的路面遗撒识别方法,其特征在于,所述步骤二中的增加不同特征层之间的连接具体为:增加相邻层之间的连接,使得某一卷积层不再只依赖于前一层输出,而是直接依赖于之前所有层的输出。
4.根据权利要求1所述的基于深度学习的路面遗撒识别方法,其特征在于,所述步骤一具体为:
a.拍摄以公路为背景的遗撒照片和视频,并对其进行逐帧提取,得到分别命名为box、carton、bottle、paper、bag、roadblock、stone、sand、plasticbag、package的共十类遗撒图片;
b.获取互联网上公开数据集中与路面遗撒相关的物体图片;
c.将a和b中的图片的分辨率统一,并用labelImg对图片中的遗撒进行标注,生成xml格式的标记信息,随后编写python脚本,分别生成包含所有图片的文件名和完整路径的txt文件,由此构造由实拍数据集和互联网上公开数据集组成的自制数据集。
5.根据权利要求4所述的基于深度学习的路面遗撒识别方法,其特征在于,所述步骤一还包括:将互联网上公开数据集上的一些已有目标物体剪切、平移、放缩到从实拍数据集中剪切出的真实道路场景的随机位置来增多样本。
6.根据权利要求4或5所述的基于深度学习的路面遗撒识别方法,其特征在于,所述步骤一还包括:利用已有的图像处理手段,对自制数据集中的数据进行调整,以避免天气因素对遗撒检测的影响。
7.根据权利要求1所述的基于深度学习的路面遗撒识别方法,其特征在于,用系统抽样的方法对所构造的自制数据集做分割,80%用于训练,20%用于验证。
8.根据权利要求7所述的基于深度学习的路面遗撒识别方法,其特征在于,所述步骤三具体为:编写改进的YOLO模型cfg文件,确定模型结构,导入在Imagenet上预训练的卷积层参数;用随机批量梯度下降算法从训练集中采样一批次数据对改进的YOLO模型参数进行优化,数次优化后在用于验证集上进行测试,循环往复,直到该用于验证集上的准确率不再提高时,停止训练。
9.根据权利要求1所述的基于深度学习的路面遗撒识别方法,其特征在于,所述步骤四具体为:按适当帧率从摄像头得到照片,用传统图像处理方法降噪、锐化后上传到GPU显存;逐级在其上计算改进的YOLO模型的每一层,获得输出;筛选合适的边界框,最终输出置信值足够高的目标的位置、大小、种类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810592958.2/1.html,转载请声明来源钻瓜专利网。