[发明专利]基于中心点监督信息的文本检测方法在审
申请号: | 202110266212.4 | 申请日: | 2021-03-10 |
公开(公告)号: | CN113065411A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 刘义江;陈蕾;侯栋梁;池建昆;范辉;阎鹏飞;魏明磊;李云超;姜琳琳;辛锐;陈曦;杨青;沈静文;吴彦巧;姜敬;檀小亚;师孜晗 | 申请(专利权)人: | 国网河北省电力有限公司;国网河北省电力有限公司雄安新区供电公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62;G06N3/04 |
代理公司: | 石家庄新世纪专利商标事务所有限公司 13100 | 代理人: | 齐兰君;杨钦祥 |
地址: | 050022 *** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 中心点 监督 信息 文本 检测 方法 | ||
本发明公开了一种基于中心点监督信息的文本检测方法,涉及票据文本检测技术领域,尤其是一种基于中心点监督信息的文本检测方法,其包括:寻找火车票的边界;对火车票图片经过ResNet50卷积神经网络做特征提取;通过FPN网络对提取的特征图进行融合;通过FPN产生五种不同的输出:文本区域,文本中心线区域,圆盘半径,圆盘的sin值以及圆盘的cos值产生最终的检测结果。本发明主要针对火车票中的规则文本进行检测。通过将文本拆分为子区域(圆盘)进行预测,降低了训练的难度,FPN模块使得网络更具有泛华性。利用圆盘表示的方法避免了直接利用文本区域带来的粘连问题。本方法能够有效的解决火车票中内容检测问题。
技术领域
本发明属于票据文本检测技术领域,尤其是一种基于中心点监督信息的文本检测方法。
背景技术
火车票是企业差旅费报销中的一个重要组成部分,其中包含了起始站点、出行日期、金额等多项报销所必需信息,然而,目前主要由申请人员手动填写录入信息,非常的耗时耗力,如果能将深度学习技术要用到火车票报销上,实现信息的自动提取,将会极大的节省人力资源成本。
火车票信息自动提取流程包含了检测和识别两个阶段。作为整个流程的基础步骤,检测环节面临着更多的问题。当前的车票主要采用墨式打印,会出现纸张穿透、字体不清晰以及内容倾斜等问题。而且,用户对这些票据的不当保管可能会造成褶皱,这对检测造成影响。并且,现有情况下的扫描设备成像效果、扫描时的光照条件等,均会导致上传的图像不清楚,给检测增加了难度。
针对文本检测问题,现有的基于深度学习的方法主要分为基于回归和基于分割两种。基于回归的方法具有较高的速度但是对文字区域的边界部分无法很好处理,而在火车票的检测场景下,漏检、边界不正确会极大的影响后续其他处理。基于分割的方法往往会产生文本的粘连问题,本专利主要用于解决火车票中的文本检测问题。
发明内容:
本发明提供了一种基于中心点监督信息的文本检测方法,用于解决现有技术中火车票打印和/或保管不当导致采集的图像不清楚增加了检测难度的问题。
本发明的技术方案主要模块包括如下:该系统包括三个部分,第一部分是基于ResNet50的图片特征提取模块;第二部分采用FPN进行不同尺度的信息融合;第三部分为基于融合的结果来产生5类预测结果(文本区域,文本中心线区域,圆盘半径,圆盘的sin值),利用本方法提出的striding方法进行后处理操作。在第一部分中,我们使用ResNet50作为骨干网络,并去掉了最后的池化层和全连接层,得到5种不同尺度的特征。第二部分中,我们利用特征金字塔模块FPN对第一部分中得到的5种不同尺度的特征进行空间信息融合,在融合之后,利用大小为1x1的卷积核对融合后的特征进行降维以减少网络参数,提高系统速度。在第三部分中,利用多层卷积来产生五种不同的输出:文本区域,文本中心线区域,圆盘半径,圆盘的sin值,并利用本方法提出的striding算法将这五种不同的组件结合在一起形成文本区域。
本发明采用如下技术方案:一种基于中心点监督信息的文本检测方法,包括如下步骤:
S100:寻找火车票的边界;
S200:对火车票图片经过ResNet50卷积神经网络做特征提取;
S300:通过FPN网络对提取的特征图进行融合;
S400:通过FPN产生五种不同的输出:文本区域,文本中心线区域,圆盘半径,圆盘的sin值以及圆盘的cos值产生最终的检测结果。
进一步地,S100:寻找火车票的边界包括如下步骤:
S110:将图片做灰度化处理;
S120:利用opencv寻找到图片中物体的边界信息;
S130:利用火车票的蒙版,对未灰度化的图片进行旋转操作,丢弃背景信息,只保留火车票;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网河北省电力有限公司;国网河北省电力有限公司雄安新区供电公司,未经国网河北省电力有限公司;国网河北省电力有限公司雄安新区供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110266212.4/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置