[发明专利]一种文字提取方法、图像处理设备和计算机可读存储介质在审
| 申请号: | 202010225359.4 | 申请日: | 2020-03-26 |
| 公开(公告)号: | CN111695550A | 公开(公告)日: | 2020-09-22 |
| 发明(设计)人: | 李佳;杨阳;刘旭东 | 申请(专利权)人: | 遥相科技发展(北京)有限公司 |
| 主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34;G06K9/38 |
| 代理公司: | 佛山粤进知识产权代理事务所(普通合伙) 44463 | 代理人: | 王储 |
| 地址: | 100000 北京市海淀区学*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 文字 提取 方法 图像 处理 设备 计算机 可读 存储 介质 | ||
本发明公开了一种文字提取方法、图像处理设备和计算机可读存储介质。该方法包括:获取待提取图像;将待提取图像的每个像素点的R值、G值和B值调整为灰度值,生成灰度图像;获取灰度图像中每个像素点的灰度像素值,将灰度像素值大于或等于预设阈值的像素点赋予第一数值,将灰度像素值小于预设阈值的像素点赋予第二数值,生成二值图像;根据具有第一数值的像素点的行坐标对二值图像进行行提取,获取行文字图像;获取每个文字的宽度,根据每个文字的宽度获取行文字图像中的单个文字图像;提取单个文字图像中的待提取文字。通过上述方式,本发明能够有效提升了文字提取的准确性和可靠性,也有效提升了工作效率。
技术领域
本发明涉及图像处理领域,特别是涉及一种文字提取方法、图像处理设备和计算机可读存储介质。
背景技术
对于OCR(Optical Character Recognition,光学字符识别)来说,能否准确地对文字进行提取,是非常重要的一个环节。
目前针对文字提取中,首先完成行切分,然后再行切分出来基础上再做字的切分。对于行切分根据行与行的空白间隙处的水平积分投影理论值为0,而文字行的水平积分投影不为0的原理。对文字的各行进行水平投影积分而获取对应文字行位置。然后再每一行文字的基础上逐个切分文字。这里面有2个小的不足。一是对行的水平投影积分,需要做逻辑判断,占用计算资源和效率不高;二是对于文字的分割,对文字的切割宽度采用经验值,如果一个印刷体既有文字,又有数字,在默认文字切割宽度下就会进行反复手动调整,造成效率不高。
发明内容
本发明主要解决的技术问题是能够有效提升了文字提取的准确性和可靠性,也有效提升了工作效率。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种文字提取方法,包括:获取待提取图像,所述待提取图像包括至少一行待提取文字行,每行所述待提取文字行包括至少一个待提取文字;将所述待提取图像的每个像素点的R、G和B值调整为灰度值,生成灰度图像;获取所述灰度图像中每个像素点的灰度像素值,将所述灰度像素值大于或等于预设阈值的像素点赋予第一数值,将所述灰度像素值小于所述预设阈值的像素点赋予第二数值,生成二值图像;根据具有第一数值的像素点的行坐标对所述二值图像进行行提取,获取行文字图像;获取每个文字的宽度,根据所述每个文字的宽度获取所述行文字图像中的单个文字图像;提取所述单个文字图像中的所述待提取文字。
其中,所述将所述待提取图像的每个像素点的R、G和B值调整为灰度值的步骤,包括:为所述R值、G值和B值赋予不同的权重,将每个所述像素点的所述R值、G值和B值分别乘以各自的权重后相加,获取每个所述像素点的灰度值。
其中,所述获取所述灰度图像中每个像素点的灰度像素值的步骤之后,包括:采用OTSU算法计算出所述灰度图像的预设阈值。
其中,所述根据具有第一数值的像素点的行坐标对所述二值图像进行行提取的步骤,包括:获取所有具有第一数值的所述像素点的第一行坐标,统计所述第一行坐标在每一行的分布频数,根据所述分布频数生成分布向量;计算所述分布向量和单位向量的卷积,根据所述卷积获取每一行文字图像的初始行坐标。
其中,所述根据所述卷积获取每一行文字图像的初始行坐标的步骤,包括:获取所述卷积值为2时的第二行坐标,将所述第一行坐标除去所述第二行坐标获取第三行坐标,所述第三行坐标为所述每一行文字图像的初始坐标。
其中,所述获取每个文字的宽度的步骤,包括:获取每个所述行文字图像中文字的行高,根据所述行高获取所述行文字图像中所述每个文字的宽度。
其中,所述根据所述行高获取所述行文字图像中所述每个文字的宽度的步骤,包括:对所述二值图像进行行投影和列投影,分别获取所述至少一行待提取文字之间的行间距和每行待提取文字之间的字间距;获取行间距最小值和字间距最小值,根据所述行高、所述行间距最小值和所述字间距最小值计算出所述每个文字的宽度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于遥相科技发展(北京)有限公司,未经遥相科技发展(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010225359.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





