[发明专利]一种基于图像处理的填注标记识别方法有效
申请号: | 201310148949.1 | 申请日: | 2013-04-26 |
公开(公告)号: | CN103310211A | 公开(公告)日: | 2013-09-18 |
发明(设计)人: | 王俊峰;高琳;姬郁林;李虹 | 申请(专利权)人: | 四川大学 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/54 |
代理公司: | 成都信博专利代理有限责任公司 51200 | 代理人: | 舒启龙 |
地址: | 610065 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图像 处理 注标 识别 方法 | ||
技术领域
本发明涉及图像处理、计算机视觉技术领域,具体涉及一种基于图像处理的填注标记识别方法。
背景图像技术
在数据采集方式中,问卷调查是一种最为常用的方式。通常被调查者先在纸质调查表上进行填写,然后调查人员将问卷收集后,通过手工录入将信息转换成计算机可以处理的数字信息,再进行数据的统计分析。随着社会的信息化发展,越来越多的调查数据需要输入至计算机进行处理,手工录入的方式由于其存在成本高、速度慢、易出错等难以克服的缺陷,往往不能满足实际需求。将调查问卷扫描成数字图像,利用图像处理技术对问卷图像进行自动识别和录入,将极大提高调查问卷的处理效率。
针对问卷图像的识别,目前主要有两种方式,一种是对问卷中手工填写的字符进行OCR(Optical Character Recognition,光学字符识别)识别,能够识别数字、字母或汉字,由于字符种类繁多,数量庞大,并且每个人的书写风格不同,因此对手写体字符的识别难度很大,一些技术难点短期内还难以突破,目前的识别技术在识别率和识别速度上远不能达到实用化的要求。另一种是识别问卷中特定的手写符号,如打钩、画圈等,称为OMR(Optical Mark Recognition,光学标记识别),其结构相对简单,出现了一些实用的识别系统,因此目前的调查问卷大多设计成选择类型的问卷,以便于后期处理。传统的标记识别是利用光电转换原理,将光信号转化为模拟电信号,再转为数字信号,通过数字滤波处理进行识别。这种方式存在很多限制,需要被调查者严格按照特定的方式进行填画,同时对纸张和印刷的质量的要求很高,在实际应用中会造成很多不便,从而引起较大的识别误差。
针对上述问题,通过拍摄或扫描等方式采集调查问卷图像,利用数字图像处理技术进行识别,是解决这些问题的有效途径,而对问卷图像进行识别的难点在于,手写标记存在不同程度的变形,图像光照不足或过度造成图像质量低,以及纸张褶皱、污损等引起的标记难以辨识等。目前针对手写标记的图像识别研究主要集中在:1、标记区域的定位。目前常用的方法是根据手工获取的版面结构信息,结合图像中检测出的几个定位特征,估计出每个标记的位置。这种方法准确度较高,但当调查问卷的结构发生变化时,需要对保存的结构数据进行手工修改,因此该方法缺乏灵活性,不具有普通适用性。2、标记的特征提取。针对标记的图像特征,主要分为统计特征和结构特征。统计特征主要包括密度特征,矩特征和投影特征,这些特征对噪声不敏感,但是难以描述标记的笔画结构,特征的可区分性不强。结构特征主要是通过分析标记的轮廓或骨架,提取出的反映标记笔画结构的特征,较好地描述了标记的细节,但是易受噪声的干扰。
发明内容
本发明的目的在于提供一种基于图像处理的填注标记识别方法,解决了目前计算机对手写标记的图像识别方式不够灵活,不具有普遍适用性,以及识别度低的问题。
为解决上述的技术问题,本发明采用以下技术方案:
一种基于图像处理的填注标记识别方法,包括以下步骤:
-将用于手工采集的文件转化为灰度图像,对灰度图像进行高斯平滑处理,去除灰度图像中的噪声;
-将灰度图像划分为多个图像块,根据每个图像块的灰度分布信息,采用最大类间方差法计算出图像块的分割阈值,根据分割阈值将图像块分为前景图像和背景图像两个部分,分别建立前景图像和背景图像的灰度直方图,通过分析直方图校正错分的前景图像,得到最终的二值化图像;
-利用投影法对二值化图像进行倾斜校正,然后根据水平方向上的投影直方图切分出文档中的每行字符,对每行字符建立垂直方向上的投影直方图,进而切分出每个字符,建立选择框的图像模板,通过将每个切分出的字符归一化后与模板进行匹配,检测出灰度图像中没有填画的选择框;
-根据未采集数据的空白文件的版面信息,建立版面结构模板,将检测出灰度图像中没有填画的选择框与版面结构模板进行匹配,定位出填画过的选择框,然后利用版面结构模板上的选择框图像模板,通过模板配准及求差的方式,去除填画区域中的选择框线,从而提取出填画标记;
-在填画标记的区域中设置滑动窗口,计算出窗口中的局部二值模式(Local Binary Pattern,LBP),通过改变滑动窗口的尺寸,提取多尺度下的局部二值模式特征,将这些局部二值模式特征的值进行级联,得到最终的标记特征;
-采用支持向量机(Support Vector Machine,SVM)对提取的标记特征进行识别。
更进一步的技术方案是,所述根据未采集数据的空白文件的版面信息,建立版面结构模板的方法如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310148949.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序