[发明专利]基于SVM的票据图像分类方法有效
申请号: | 201610593126.3 | 申请日: | 2016-07-26 |
公开(公告)号: | CN106096667B | 公开(公告)日: | 2017-11-10 |
发明(设计)人: | 邵一婷;车少帅;于志文;胡笳;沈宇 | 申请(专利权)人: | 江苏鸿信系统集成有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06K9/36 |
代理公司: | 南京钟山专利代理有限公司32252 | 代理人: | 戴朝荣 |
地址: | 210005 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 svm 票据 图像 分类 方法 | ||
技术领域
本发明属于图像处理领域,尤其涉及一种基于SVM的票据图像分类方法。
背景技术
在票据的管理上,传统票务管理依靠人工,人力成本较高,效率低,而且在票据比较多,任务比较紧的时候,传统的方法需人力熬夜加班,甚至都无法完成指标,因此票据自动分类系统应运而生。
票据自动分类通过对票据扫描成的票据图像的分析,采用图像处理方法自动分类票据。目前的票据自动分类方法主要分为两类,第一类是采用模板匹配方法,此方法通过将每一种类型的票据标准图像制作成模板图像,通过将待识别的图像和每类模板进行模板匹配,将票据识别为匹配率最高的那一类;第二类是通过OCR的方法,识别票据中的特殊的数字和字母,对识别出的数字和字母进行类型识别,完成图像的分类。但现有的票据分类方法存在一定的问题:首先第一类的方法和第二类的方法均从整幅图像出发,复杂性高,时间成本高;第一类的方法和第二类的方法没有倾斜校正的机制,若图像中的目标物体位置倾斜,会影响图像的匹配结果以及OCR字段识别,此时误检率较高;第一类采用模板匹配的方法需要将票据同每一类的模板进行匹配,耗时高,尤其是当票据种类较多时,此类方法呈现明显的弱势;第二类通过OCR的方法,识别图像的特殊字段来分类票据,由于不同的票据有可能包含相同的标题字段,从而造成较高概率的错误分类;第一类的方法和第二类的方法中,没有错误分类机制,它们将待识别的每一幅图像都分成我们要处理的票据类别,而实际财务处理中,会出现很多不是我们需要的票据,将这些票据加入到财务系统不仅不会减轻财务人员的工作,反而无形中增加了劳动成本。
发明内容
本发明所要解决的技术问题是针对上述现有技术的不足提供一种基于SVM的票据图像分类方法,基于SVM的票据图像分类方法能准确的去除不属于用户需要的票据图像,即提供了去除非待识别票据图像的机制,使票据图像的管理更加系统化,完善化;对票据图像的公章区域进行处理,克服了从票据图像整体进行处理的缺陷,提高了检测的速度;对票据图像进行倾斜校正,克服了由于票据图像的倾斜而造成识别错误的情况;采用SVM分类方法,分类结果更加准确。
为实现上述技术目的,本发明采取的技术方案为:
基于SVM的票据图像分类方法,包括以下步骤:
(1)选取多张标准票据图像,作为样本进行SVM分类器训练,得到性能优化的SVM分类器;截取每一种类型的标准票据中的公章图像并将所有的公章图像组合成一幅公章模板;
(2)对待识别的原图像进行二值化,通过Hough变换检测直线的方法提取二值化后的图像中的所有的直线,设定两条直线之间的距离阈值,将图像中直线之间的距离小于距离阈值的两条直线合并成一条直线;设定直线数目的最大数目阈值和最小数目阈值,若图像中所有直线的数目不在最大数目阈值和最小数目阈值之间,则将此待识别的原图像分类为非识别票据图像,否则执行步骤(3);
(3)对待识别的原图像进行倾斜校正;
(4)根据公章的亮度特征设定公章的最大灰度阈值和最小灰度阈值,选取待识别的原图像中灰度值在最大灰度阈值和最小灰度阈值之间的所有像素,判断选取的每个像素的颜色并过滤不属于公章部分颜色范围的像素点从而得到轮廓集合,从轮廓集合中剔除面积较小的轮廓从而得到待识别的原图像中公章的轮廓;
(5)将步骤(4)得到的公章轮廓与步骤(1)得到的公章模板进行匹配,若匹配不成功,则将待识别的原图像分类为非识别票据图像,若匹配成功,则执行步骤(6);
(6)提取公章轮廓的HOG特征,作为步骤(1)中性能优化的SVM分类器的输入,得出待识别的原图像的票据类型。
作为本发明进一步解决的技术方案,所述对待识别的原图像进行倾斜校正,包括:
以待识别的原图像的左上角为原点,待识别的原图像的水平向右方向为X轴的正方向,待识别的原图像的垂直向下方向为Y轴的正方向,建立坐标系;
通过Hough变换检测直线的方法提取待识别的原图像中的所有直线,将待识别的原图像中的直线与X轴的正方向的夹角作为直线角度;
查找待识别的原图像中两条直线之间的夹角为90度的所有直线对,将所有直线对中角度最小的直线角度作为待识别的原图像的旋转角度,将待识别的原图像进行逆时针旋转,实现待识别的原图像的倾斜较正;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏鸿信系统集成有限公司,未经江苏鸿信系统集成有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610593126.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序