[发明专利]针对印刷字体的ocr中字体分割错误的纠正方法在审
申请号: | 201810741477.3 | 申请日: | 2018-07-05 |
公开(公告)号: | CN110688882A | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 袭喜悦;杨公所 | 申请(专利权)人: | 山东华软金盾软件股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34 |
代理公司: | 11641 北京金宏来专利代理事务所(特殊普通合伙) | 代理人: | 许振强;苗彩娟 |
地址: | 250000 山东省济南市高新区舜华路1号齐鲁软*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分割 垂直投影 二值化操作 二值化处理 水平投影 算法计算 文字分割 印刷字体 有效像素 二值化 识别率 行分割 中英文 纠正 算法 字体 场景 重复 统计 图片 | ||
针对印刷字体的ocr中字体分割错误的纠正方法,本发明使用水平投影算法,对文字进行分割,将分割好的行进行垂直投影,分割出每个文字,输入分割好的单行文字,在分割之前的二值化处理时,通过以下算法计算出一个阈值:取行分割之后有效像素最多的一行,然后取一个阈值执行二值化操作,再对其进行垂直投影计算,统计该行有效分割的字符数量,在一定范围内重复该操作,取分割数量最多时对应的阈值为最终分割时使用的二值化阈值;本发明提供的纠正方法提高了处理速度,节省了时间,而且在处理中英文混合的图片时不会影响正常的文字分割,提高了对整个OCR的识别率,而且适应场景更多,实用性强。
技术领域
本发明涉属于ocr中字体分割错误的纠正方法,具体的说是一种针对印刷字体的ocr中字体分割错误的纠正方法。
背景技术
Hough变换是数字图象技术中一种有效的发现直线的算法,它是先把直角坐标系的目标点映射到极坐标系上进行累积,即它是先使直角坐标系平面上任一直线上的所有点均累积到极坐标系的同一点集中去,然后通过寻找极坐标系中点集的峰值,来发现长的直线特征,由于这种点集是通过累积统计得到的,因而能够容忍直线的间断。OCR技术是光学字符识别的缩写(Optical Character Recognition),是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。但是在对图像内容进行识别时往往会出现一些识别错误的情况,现有的技术是通过重新对错误的字符进行分割的方法来进行错误的纠正,这样做会比较耗时,而且起到的作用往往不大,并且容易对后面的内容产生影响。现有的OCR识别在做补偿时,主要是在分割这一步上来进行分割错误的补偿操作,主要采用垂直投影结合等比例分割等方式来进行补偿,这种做法在处理一些中英文混合的图片时,会影响正常的文字分割,对整个OCR的识别起到负面的作用。
发明内容
为了解决上述技术问题的不足,本发明提供了一种针对印刷字体的ocr中字体分割错误的纠正方法,该纠正方法节省了时间,而且在处理中英文混合的图片时不会影响正常的文字分割,对整个OCR的识别起到积极作用。
为了实现上述目的,本发明采用的技术方案为,其步骤为:
步骤一:使用水平投影算法,对文字进行分割,将分割好的行进行垂直投影,分割出每个文字,输入分割好的单行文字,在分割之前的二值化处理时,通过以下算法计算出一个阈值:取行分割之后有效像素最多的一行,然后取一个阈值执行二值化操作,再对其进行垂直投影计算,统计该行有效分割的字符数量,在一定范围内重复该操作,取分割数量最多时对应的阈值为最终分割时使用的二值化阈值;
步骤二:按顺序取出一个字符通过模型判断输入的数据类型是汉字还是字母、数字,如果是字母或者数字则直接执行步骤八,如果是其他的则执行步骤三;
步骤三:通过计算输入字符像素的大小比例判断是否为一个完整的汉字,如果是则执行步骤八,如果不是则执行步骤四;
步骤四:判断当前字符是否为最后一个字符,如果是则执行步骤六,否则执行步骤五;
步骤五:从输入的字符行中取出当前字符数据的下一个数据,结合在一块判断是否组合为一个完整的汉字结构,如果是则执行步骤八,否则执行步骤六;
步骤六:判断是否为最后一个字符,如果是则执行步骤八,否则执行步骤七;
步骤七:按照顺序取下一个字符数据与步骤五中已经组合在一起的前两个字符进行组合然后执行步骤八;
步骤八:把分割好的字符数据输入识别模型进行识别,重复步骤二到步骤七操作,直到识别完最后一个字符。
本发明的有益效果为:本发明提供的纠正方法提高了处理速度,节省了时间,而且在处理中英文混合的图片时不会影响正常的文字分割,提高了对整个OCR的识别率,而且适应场景更多,实用性强。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东华软金盾软件股份有限公司,未经山东华软金盾软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810741477.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种称重传送视觉模块
- 下一篇:车辆和行人检测方法及装置