[发明专利]一种利用深度学习技术识别火车票的方法在审
申请号: | 201910444764.2 | 申请日: | 2019-05-27 |
公开(公告)号: | CN110135395A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 孙宁远;王天卿;李锐 | 申请(专利权)人: | 济南浪潮高新科技投资发展有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 冯春连 |
地址: | 250100 山东省济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 学习神经网络 火车票 采集图像 技术识别 标注 计算机视觉技术 预处理 图像检测技术 图像 技术核心 人工检票 输出结果 网络模型 自动识别 测试集 口位置 匹配度 训练集 验证集 验票 送入 采集 车站 输出 学习 部署 | ||
1.一种利用深度学习技术识别火车票的方法,其特征在于,该方法的实现过程包括:
S1、采集带有真实火车票的图像;
S2、以VOC数据集的格式为标准,标注出S1阶段采集图像中所有的火车票并生成XML文件;
S3、利用计算机视觉技术,对S1阶段采集图像进行预处理和数据增广,同时,对标注文件也做出对应变换;
S4、将S2阶段标注完成的所有图像划分为训练集、验证集、测试集;
S5、基于Keras开源框架,以Faster-RCNN为技术核心,搭建深度学习神经网络;
S6、将S3阶段获得的增广数据送入S5阶段搭建的深度学习神经网络进行大规模训练,直到深度学习神经网络的输出结果与S2阶段标注数据具有较高的匹配度,将该深度学习神经网络作为最优网络模型输出;
S7、将最优网络模型部署于车站验票口位置,验票摄像头扫描火车票并由最优网络模型进行火车票的识别,实现自动验票。
2.根据权利要求1所述的一种利用深度学习技术识别火车票的方法,其特征在于,在S5阶段,搭建深度学习神经网络的具体操作内容包括:
S5-1、以VGG16深度卷积网络为特征提取模块,对S1阶段采集图像进行特征提取;
S5-2、提取得到的特征将被一层3x3卷积核大小的卷积网络处理,并将结果正向传播给RPN,RPN由两个模块所组成,分别用于目标类别检测和目标位置检测,其中目标类别检测器用于判断某个区域内是否可能包含目标物体,目标位置检测器用于目标位置矩形框的精细修正;
S5-3、RPN的两个模块协同工作,生成一批可能存在目标物体的矩形区域,这批矩形区域被推送到中间层Proposal Layer,该层综合了之前计算出的所有结果,推算出精准的矩形区域,并陆续传播给后面的网络结构;
S5-4、将S5-3阶段所提取出的矩形区域和S5-1阶段所获得的数据,输入到另一个模块ROIPooling,该模块将不规则的矩形区域统一化,该模块可以保证即使输入矩形的大小不同,该模块输出的具有相同的大小;
S5-5、将S5-4阶段所获得的结果输入到全连接网络并以softmax的形式输出,完成深度学习神经网络的搭建,并得到最终预测结果。
3.根据权利要求1所述的一种利用深度学习技术识别火车票的方法,其特征在于,在S1阶段,通过手机拍摄照片或者从网络上下载图像的方式采集带有真实火车票的图像,所采集图像中火车票应当占据超过图像面积的80%。
4.根据权利要求1所述的一种利用深度学习技术识别火车票的方法,其特征在于,在S2阶段,利用Github上的开源工具labelImg,对S1阶段采集图像中所有的火车票进行标注,获得用于标注火车票位置的xml文件。
5.根据权利要求1所述的一种利用深度学习技术识别火车票的方法,其特征在于,在S4阶段,划分为训练集使用的图像数量占据所采集图像总数的60%以上,划分为验证集的图像数量等于划分为测试集的图像数量。
6.根据权利要求1所述的一种利用深度学习技术识别火车票的方法,其特征在于,数据增广的方式包括但不限于图像的缩放、图像的旋转、图像的模糊、高斯噪声与椒盐噪声的混入、图像背景填充、图像的仿射变换和图像的灰度化与二值化。
7.根据权利要求6所述的一种利用深度学习技术识别火车票的方法,其特征在于,对采集图像进行数据增广时,在数据增广方式选用图像背景填充的基础上,将S1阶段采集的所有图像以不同大小、不同旋转角度、不同模糊程度嵌入到背景图当中。
8.根据权利要求6所述的一种利用深度学习技术识别火车票的方法,其特征在于,图像背景填充时,背景可以采用真实生活中的图片或桌面壁纸一类背景复杂的图像。
9.根据权利要求1所述的一种利用深度学习技术识别火车票的方法,其特征在于,在S3阶段,具体利用OpenCV计算机视觉库中的图像变换API,编写用于数据增广的脚本,将数据集扩展到10万张图像左右。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮高新科技投资发展有限公司,未经济南浪潮高新科技投资发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910444764.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:区域占用和车牌识别方法及装置
- 下一篇:地面标志的识别方法、装置、设备及介质