[发明专利]一种文本图像的倾斜角矫正方法及终端有效
申请号: | 201910189109.7 | 申请日: | 2019-03-13 |
公开(公告)号: | CN109919155B | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 庄国金;陈文传;杜保发;林玉玲;郝占龙;方恒凯;吴建杭 | 申请(专利权)人: | 厦门商集网络科技有限责任公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/36 |
代理公司: | 福州科扬专利事务所 35001 | 代理人: | 何小星 |
地址: | 361101 福建省厦*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 图像 倾斜角 矫正 方法 终端 | ||
1.一种文本图像的倾斜角矫正方法,其特征在于,包括:
矫正第一文本图像的倾斜角,得到经处理的第二文本图像;所述倾斜角的取值范围为0度至45度;
调用OCR识别引擎识别所述第二文本图像,得到第一字符串;
将所述第二文本图像旋转180度,得到经处理的第三文本图像;
调用OCR识别引擎识别所述第三文本图像,得到第二字符串;
若所述第一字符串中的高频词汇个数大于所述第二字符串中的高频词汇个数,则标记所述第二文本图像为最终文本图像;否则,标记所述第三文本图像为最终文本图像。
2.根据权利要求1所述的文本图像的倾斜角矫正方法,其特征在于,矫正第一文本图像的倾斜角,得到经处理的第二文本图像,具体为:
将所述第一文本图像旋转90度,得到经处理的第四文本图像;
对所述第一文本图像进行连通域检测,得到第一中心点集合;所述第一中心点集合由所述第一文本图像中的连通域的中心点组成;对所述第四文本图像进行连通域检测,得到第二中心点集合;所述第二中心点集合由所述第四文本图像中的连通域的中心点组成;
根据所述第一中心点集合拟合直线,得到第一直线集合;根据所述第二中心点集合拟合直线,得到第二直线集合;所述直线与水平方向的夹角小于45度;
若所述第一直线集合的元素个数大于所述第二直线集合的元素个数,则根据所述第一直线集合矫正所述第一文本图像的倾斜角,得到第二文本图像;否则:
根据所述第二直线集合矫正所述第四文本图像的倾斜角,得到第二文本图像。
3.根据权利要求2所述的文本图像的倾斜角矫正方法,其特征在于,对所述第一文本图像进行连通域检测,得到第一中心点集合,具体为:
S11、对所述第一文本图像进行连通域检测,得到所述第一文本图像中的所有连通域;
S12、水平投影所述第一文本图像,将投影落入同一区段内的连通域添加至同一个连通域集合,得到多个连通域集合;
S13、从所述多个连通域集合中获取一连通域集合;
S14、从一连通域集合中获取一连通域,得到第一连通域;
S15、从所述一连通域集合中获取与所述第一连通域相邻的另一连通域,得到第二连通域;
S16、计算所述第一连通域的高度和所述第二连通域的高度的平均值,得到平均字符宽度;
S17、若所述第一连通域的高度与所述第二连通域的高度的差值小于预设的高度阈值,且所述第一连通域的外接矩形与所述第二连通域的外接矩形之间的水平间距小于所述平均字符宽度,则添加所述第一连通域的中心点和所述第二连通域的中心点至预设的第三中心点集合;
S18、重复执行所述步骤S14至所述步骤S17,直至所述一连通域集合被遍历;
S19、重复执行所述步骤S13至所述步骤S18,直至所述多个连通域集合被遍历,得到多个所述第三中心点集合;所述第一中心点集合由多个所述第三中心点集合组成。
4.根据权利要求3所述的文本图像的倾斜角矫正方法,其特征在于,根据所述第一中心点集合拟合直线,得到第一直线集合,具体为:
S21、根据一所述第三中心点集合拟合直线,并添加所述直线至所述第一直线集合;
S22、重复执行所述步骤S21,直至所有的所述第三中心点集合被遍历。
5.根据权利要求1所述的文本图像的倾斜角矫正方法,其特征在于,根据所述第一直线集合矫正所述第一文本图像的倾斜角,得到第二文本图像,具体为:
S1、从所述第一直线集合中获取一直线的倾斜角,得到第一倾斜角;
S2、若所述第一倾斜角与所述第一直线集合中除所述一直线之外的另一直线的倾斜角的差值小于预设的倾斜角阈值,则添加所述另一直线至预设的第三直线集合;
S3、重复执行所述步骤S2,直至所述第一直线集合被遍历;
S4、重复执行所述步骤S1至S3,直至所述第一直线集合被遍历,得到多个所述第三直线集合;
S5、获取元素个数最多的一所述第三直线集合,得到第四直线集合;
S6、根据所述第四直线集合中各直线的倾斜角获取最优旋转角度;
S7、将所述第一文本图像旋转所述最优旋转角度,得到第二文本图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门商集网络科技有限责任公司,未经厦门商集网络科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910189109.7/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序