[发明专利]一种金融票据大写金额处手写汉字的分割方法有效
申请号: | 202011160188.8 | 申请日: | 2020-10-27 |
公开(公告)号: | CN112016566B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 张振彬;刘贯伟;王伟;张云峰;安增花;武艳红 | 申请(专利权)人: | 恒银金融科技股份有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/20;G06T7/11;G06T7/136;G06T7/194 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 300308 天津市滨海新*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 金融 票据 大写 金额 手写 汉字 分割 方法 | ||
1.一种金融票据大写金额处手写汉字的分割方法,其特征在于,包括以下步骤:
选取大写金额处手写汉字区域;
计算图像最佳分割阈值;
利用最佳分割阈值对图像进行二值化,得到手写体汉字和背景分割的二值化图像;
横向投影计算汉字平均高度;
纵向投影确定最优宽度序列;
利用平均高度及最优宽度序列分割大写金额处手写汉字;
其中,针对初步的宽度序列,采用近似间隔的方法来确定汉字的最优宽度序列,包括如下步骤:
统计汉字边界处的最大像素点个数为s,小于s个像素点数即被认为是近似间隔b,每行手写体汉字可得到b1,b2,b3......bn约n个近似间隔;
对n个近似间隔取平均值Mn,Mn=(b1+b2+b3+......+bn)/n;
依据判定条件:Mn-5 b 且 b Mn+5,得到有效的间隔:b1’,b2’,b3’......bm’;
由有效间隔点对应的坐标位置计算得到最优宽度序列。
2.根据权利要求1所述的一种金融票据大写金额处手写汉字的分割方法,其特征在于,利用大律法计算图像最佳分割阈值:遍历图像灰度值并求和取平均值,得到初步分割的阈值,遍历阈值从0到255,每次遍历需计算前景和背景的方差值,当方差值取得最大时,判定前景和背景的差异最大,此时得到的阈值为最佳分割阈值。
3.根据权利要求2所述的一种金融票据大写金额处手写汉字的分割方法,其特征在于,得到初步分割的阈值后,分别计算前景和背景的点数、质量矩、平均灰度,得到前景和背景的方差值。
4.根据权利要求3所述的一种金融票据大写金额处手写汉字的分割方法,其特征在于,前景和背景图象的方差值计算公式如下:
g=w0*(u0-u)*(u0-u)+w1*(u1-u)*(u1-u)=w0*w1*(u0-u1)*(u0-u1) 公式1
其中:g是前景和背景的方差值;w0是前景像素点数占图像总像素数的比例值;u0是前景中的平均灰度;w1是背景像素点数占图像总像素数的比例值,u1是背景中的平均灰度;u是图像的总平均灰度。
5.根据权利要求4所述的一种金融票据大写金额处手写汉字的分割方法,其特征在于,图像的总平均灰度的计算公式如下:
u=w0*u0+w1*u1 公式2。
6.根据权利要求1 所述的一种金融票据大写金额处手写汉字的分割方法,其特征在于,对二值化图像进行横向投影,计算每行汉字区所占像素点个数,以行像素点数作为限定条件,排除干扰点,得到有效连续的行数,即为汉字平均高度。
7.根据权利要求1 所述的一种金融票据大写金额处手写汉字的分割方法,其特征在于,使用汉字平均高度值截取横向投影图像,再对其进行纵向投影,得到垂直方向上各列有效像素点个数,即初步的宽度序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恒银金融科技股份有限公司,未经恒银金融科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011160188.8/1.html,转载请声明来源钻瓜专利网。