[发明专利]一种字符分割方法及终端在审
| 申请号: | 201910208497.9 | 申请日: | 2019-03-19 |
| 公开(公告)号: | CN109948620A | 公开(公告)日: | 2019-06-28 |
| 发明(设计)人: | 庄国金;郝占龙;陈文传;杜保发;林玉玲;吴建杭;方恒凯 | 申请(专利权)人: | 厦门商集网络科技有限责任公司 |
| 主分类号: | G06K9/34 | 分类号: | G06K9/34 |
| 代理公司: | 福州科扬专利事务所 35001 | 代理人: | 何小星 |
| 地址: | 361101 福建省厦*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 字符分割 字符图像 预设 集合 置信度 终端 数据处理领域 垂直投影 字符组成 调用 引擎 合并 分割 | ||
1.一种字符分割方法,其特征在于,包括:
采用垂直投影法分割字符图像中的字符,得到字符有序集合;
当第一字符的宽度小于预设的下限值时,获取所述字符图像中与所述第一字符相邻的字符,得到第二字符;所述第一字符为所述字符有序集合中的一字符;
调用OCR识别引擎识别第三字符,得到第一OCR识别结果;所述第三字符由所述第一字符和所述第二字符组成;
若所述第一OCR识别结果的置信度大于预设的置信度阈值,且所述第三字符的宽度小于预设的上限值,则合并所述字符有序集合中的所述第一字符和所述第二字符。
2.根据权利要求1所述的字符分割方法,其特征在于,还包括:
当第四字符的宽度大于所述预设的上限值时,获取第五字符和第六字符;所述第四字符为所述字符有序集合中的一字符;所述第四字符由所述第五字符和所述第六字符组成;
调用OCR识别引擎识别所述第五字符,得到第二识别结果;
调用OCR识别引擎识别所述第六字符,得到第三识别结果;
若所述第二识别结果的置信度和所述第三识别结果的置信度均大于所述预设的置信度阈值,则将所述字符有序集合中的所述第四字符分割成所述第五字符和所述第六字符。
3.根据权利要求1所述的字符分割方法,其特征在于,获取所述预设的上限值和下限值的步骤为:
统计所述字符有序集合的平均字符宽度;
所述上限值为所述平均字符宽度的1.2倍;
所述下限值为所述平均字符宽度的80%。
4.根据权利要求1所述的字符分割方法,其特征在于,采用垂直投影法分割字符图像中的字符,得到字符有序集合,具体为:
S1、二值化所述字符图像,得到二值图像;
S2、从所述二值图像中获取一行字符的图像,得到行图像;
S3、垂直投影所述行图像,得到垂直投影直方图;所述垂直投影直方图的横坐标表示一黑色像素点在所述行图像中的水平位置;所述垂直投影直方图的纵坐标表示黑色像素点个数;
S4、获取所述垂直投影直方图中,纵坐标值为零的点的横坐标值,得到坐标值集合;
S5、根据所述坐标值集合分割所述行图像,得到行字符有序集合;
S6、重复执行所述步骤S2至所述步骤S5,直至所述二值图像所有行均被遍历;所述字符有序集合由所有的所述行字符有序集合组成。
5.一种字符分割终端,其特征在于,包括一个或多个处理器及存储器,所述存储器存储有程序,并且被配置成由所述一个或多个处理器执行以下步骤:
采用垂直投影法分割字符图像中的字符,得到字符有序集合;
当第一字符的宽度小于预设的下限值时,获取所述字符图像中与所述第一字符相邻的字符,得到第二字符;所述第一字符为所述字符有序集合中的一字符;
调用OCR识别引擎识别第三字符,得到第一OCR识别结果;所述第三字符由所述第一字符和所述第二字符组成;
若所述第一OCR识别结果的置信度大于预设的置信度阈值,且所述第三字符的宽度小于预设的上限值,则合并所述字符有序集合中的所述第一字符和所述第二字符。
6.根据权利要求5所述的字符分割终端,其特征在于,还包括:
当第四字符的宽度大于所述预设的上限值时,获取第五字符和第六字符;所述第四字符为所述字符有序集合中的一字符;所述第四字符由所述第五字符和所述第六字符组成;
调用OCR识别引擎识别所述第五字符,得到第二识别结果;
调用OCR识别引擎识别所述第六字符,得到第三识别结果;
若所述第二识别结果的置信度和所述第三识别结果的置信度均大于所述预设的置信度阈值,则将所述字符有序集合中的所述第四字符分割成所述第五字符和所述第六字符。
7.根据权利要求5所述的字符分割终端,其特征在于,获取所述预设的上限值和下限值的步骤为:
统计所述字符有序集合的平均字符宽度;
所述上限值为所述平均字符宽度的1.2倍;
所述下限值为所述平均字符宽度的80%。
8.根据权利要求5所述的字符分割终端,其特征在于,采用垂直投影法分割字符图像中的字符,得到字符有序集合,具体为:
S1、二值化所述字符图像,得到二值图像;
S2、从所述二值图像中获取一行字符的图像,得到行图像;
S3、垂直投影所述行图像,得到垂直投影直方图;所述垂直投影直方图的横坐标表示一黑色像素点在所述行图像中的水平位置;所述垂直投影直方图的纵坐标表示黑色像素点个数;
S4、获取所述垂直投影直方图中,纵坐标值为零的点的横坐标值,得到坐标值集合;
S5、根据所述坐标值集合分割所述行图像,得到行字符有序集合;
S6、重复执行所述步骤S2至所述步骤S5,直至所述二值图像所有行均被遍历;所述字符有序集合由所有的所述行字符有序集合组成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门商集网络科技有限责任公司,未经厦门商集网络科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910208497.9/1.html,转载请声明来源钻瓜专利网。





