[发明专利]彩色印刷纸张人工填涂信息的一种识别方法在审
申请号: | 201210314041.9 | 申请日: | 2012-08-30 |
公开(公告)号: | CN103679178A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 汪法兵;黄姗 | 申请(专利权)人: | 北京飞利信科技股份有限公司 |
主分类号: | G06K9/54 | 分类号: | G06K9/54 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100191 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 彩色 印刷 纸张 人工 信息 一种 识别 方法 | ||
技术领域
本发明涉及彩色印刷纸张上人工填涂信息识别,例如彩色扫描头电子票箱扫描的彩色选票的图像识别,彩色答题卡的填涂答案识别,属于智能化图像识别系统。
背景技术
传统的电子票箱多为黑白扫描头,扫描的选票为灰度图,存在图像质量不佳,识别不准确等问题。彩色扫描图数据量大,数据处理需要更高的技巧。而且,票箱组成结构为机械部件,电机转速不均,或者人工投票过程中手部拉扯选票,都会造成选票扫描图像存在拉伸。电子票箱进票口大于选票尺寸,会造成选票扫描头像存在倾斜,拉伸和倾斜给选票的定位识别带来困难。传统的识别算法基于模板匹配,在数据库记录的坐标附近移动模板,匹配搜索候选框区域,这种处理方法使得运算次数过多执行时间过长。传统的选票设计多为矩形选项框,椭圆,菱形等选项框的曲线形状很复杂,涉及复杂的图像识别算法,难以处理。现有的答题卡图像识别算法多是利用模板匹配根据相似度计算做答题结果识别,这种方法运算时间较长。
本发明提出了一种新的处理方法,解决了上述问题。
发明内容
针对选票识别,本发明提出了一种新的解决方法。先对选票图像做噪声处理,然后进行目标搜索识别,最后与数据库记录的坐标信息进行匹配,解决了图像随机拉伸问题,同时减少了算法执行时间,提高了识别准确性。
本方法利用R/G/B三个颜色通道的颜色差值对彩色图像二值化,二值化函数为
〔|R[i]-mean[i]|+|G[i]-mean[i]|+|B[i]-mean[i]|〕<Threshold
其中,mean[i]=〔R[i]+G[i]+B[i]〕/3,是第i个像素点的灰度均值。逐个像素点判断三个RGB差值,大于设定阈值Threshold时判定为彩色像素点,二值化为0,小于设定阈值时判定为黑白像素点,二值化为1,后续的图像基于二值图像做处理。为了增强算法的容错能力,这里的二值化阈值Threshold通过对整张图像做光栅扫描统计计算得到。逐点计算三通道颜色差值:
RGBDiff[i]=〔|R[i]-mean[i]|+|G[i]-mean[i]|+|B[i]-mean[i]|〕
整张图像的像素点数为Length,对Length个RGBDiff求均值Ave和标准差Var,图像二值化阈值可由下式得到:
Threshold=Ave-3*Var
扫描头扫描图像的R/G/B灰度值通常偏离标准色卡的灰度值,其涨落近似为高斯分布。理论上,当阈值取得小于均值三倍标准差时,二值化误差小于0.2%,能得到较好的二值图像。
根据数据库记录的候选框坐标,在选票扫描图像上进行模板匹配搜索定位,运算次数正比于模板大小乘以整张图像大小。对于A4纸张大小的选票,100DPI扫描头扫描的图像约有830*1170个像素点,候选框模板约有500个像素点,模板匹配的运算次数为
K*830*1170*500
其中K为依赖于具体匹配方法的一个常数,这个数值一般在十亿次以上。
为了减少运算次数,本发明提出了基于直线的选票图像处理方法,先对图像的点与线判断并作做去噪声处理。对于标准选票,其定位框,信息框及另选框都是标准的矩形,设矩形框宽高的最小尺寸为Width*Height。首先对整张二值图像逐行扫描,搜索行内连续的值为1像素点,若其点数大于Width-5,则保留这些像素点,否则将其值改为0,这么做就去掉了短于Width-5的直线。然后,对二值图像逐列扫描,搜索列内连续值为1的像素点,若其点数大于Height-5,则保留,否则将这些像素点的值改为0,这么做就去掉了内短于Height-5的直线。最后结果是去掉了图像噪声,只留下需要识别的目标客体,即定位框,信息框,候选框,另选框。
对图像做噪声处理,然后搜索识别目标,所需要的运算总次数约为:
L*830*1170
其中,L为一常数,依赖于具体的去噪方法。这个运算次数远小于模板匹配算法的运算次数,缩短了算法执行时间。
对选票图像先做噪声处理,再做目标识别,在另一个角度减少了噪声对识别的干扰。噪声处理去掉了二值化图像中的汉字,灰度起伏噪声点,不规则填涂笔迹,小的图像印刷污染等,最后选票图像上面只留下需要识别的目标(包括定位框,信息框,候选框,另选框),提高了识别准确度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京飞利信科技股份有限公司,未经北京飞利信科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210314041.9/2.html,转载请声明来源钻瓜专利网。