[发明专利]一种金融票据大写金额处手写汉字的分割方法有效
申请号: | 202011160188.8 | 申请日: | 2020-10-27 |
公开(公告)号: | CN112016566B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 张振彬;刘贯伟;王伟;张云峰;安增花;武艳红 | 申请(专利权)人: | 恒银金融科技股份有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/20;G06T7/11;G06T7/136;G06T7/194 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 300308 天津市滨海新*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 金融 票据 大写 金额 手写 汉字 分割 方法 | ||
本发明公开了一种金融票据大写金额处手写汉字的分割方法,其特征在于,包括以下步骤:选取大写金额处手写汉字区域;利用大律法计算图像最佳分割阈值:遍历图像灰度值并求和取平均值,得到初步分割的阈值,遍历阈值从0到255,每次遍历需计算前景和背景的方差值,当方差值取得最大时,判定前景和背景的差异最大,此时得到的阈值为最佳分割阈值;利用最佳分割阈值对图像进行二值化,得到手写体汉字和背景分割的二值化图像;横向投影计算汉字平均高度;纵向投影确定最优宽度序列;利用平均高度及最优宽度序列分割大写金额处手写汉字。
技术领域
本发明涉及薄片类纸质介质处理领域,特别是涉及一种金融票据处的大写金额处手写体汉字的分割方法。
背景技术
目前,在字符处理领域内,手写体汉字分割和识别技术发展迅猛,其识别准确率正在逐步提升,应用场景日益不断拓展,其相关产品也日渐趋于成熟,但在金融票据上大写金额处的特定识别场景下的应用效果并不理想。
不同于其他汉字手写体应用场景,金融票据上大写金额汉字种类较少,有壹 、贰、叁、肆、伍、陆、柒等共约20个,由于手写区域长度的限制,汉字相互贴近、粘连的情况很普遍,且汉字手写时字体风格因人而异,字号大小不一致,连笔、乱笔等现象频繁出现,这使得精确分割出字符变得十分困难。
发明内容
本发明的目的是针对现有技术中存在的技术缺陷,而提供一种金融票据大写金额处手写汉字的分割方法,
为实现本发明的目的所采用的技术方案是:
一种金融票据大写金额处手写汉字的分割方法,其特征在于,包括以下步骤:
选取大写金额处手写汉字区域;
利用大律法计算图像最佳分割阈值:遍历图像灰度值并求和取平均值,得到初步分割的阈值,遍历阈值从0到255,每次遍历需计算前景和背景图象的方差值,当方差值取得最大时,判定前景和背景的差异最大,此时得到的阈值为最佳分割阈值;
利用最佳分割阈值对图像进行二值化,得到手写体汉字和背景分割的二值化图像;
横向投影计算汉字平均高度;
纵向投影确定最优宽度序列;
利用平均高度及最优宽度序列分割大写金额处手写汉字。
作为优选的,得到初步分割的阈值后,分别计算前景和背景的点数、质量矩、平均灰度,得到前景和背景图象的方差值。
作为优选的,前景和背景图象的方差值计算公式如下:
g=w0*(u0-u)*(u0-u)+w1*(u1-u)*(u1-u)=w0*w1*(u0-u1)*(u0-u1) 公式1
其中:g是前景和背景的方差值;w0是前景像素点数占图像总像素数的比例值;u0是前景中的平均灰度;w1是背景像素点数占图像总像素数的比例值,u1是背景中的平均灰度;u是图像的总平均灰度。
作为优选的,图像的总平均灰度的计算公式如下:
u=w0*u0+w1*u1 公式2。
作为优选的,对二值化图像进行横向投影,计算每行汉字区所占像素点个数,以行像素点数作为限定条件,排除干扰点,得到有效连续的行数,即为汉字平均高度。
作为优选的,使用汉字平均高度值截取横向投影图像,再对其进行纵向投影,得到垂直方向上各列有效像素点个数,即初步的宽度序列。
作为优选的,针对初步的宽度序列,采用近似间隔的方法来确定汉字的最优宽度序列,包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恒银金融科技股份有限公司,未经恒银金融科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011160188.8/2.html,转载请声明来源钻瓜专利网。