[发明专利]一种低像素密度文本的识别方法有效
| 申请号: | 202010190222.X | 申请日: | 2020-03-18 |
| 公开(公告)号: | CN111414917B | 公开(公告)日: | 2023-05-12 |
| 发明(设计)人: | 李振;鲁宾宾;刘挺;陈伟强;陈远琴;孟天祥;翟昶 | 申请(专利权)人: | 民生科技有限责任公司 |
| 主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/14;G06V30/18;G06N3/0464;G06N3/08 |
| 代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 巴晓艳 |
| 地址: | 101300 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 像素 密度 文本 识别 方法 | ||
1.一种低像素密度文本的识别方法,该方法具体包括以下步骤:
S1)对待识别的低像素密度文本进行图像信息采集,并将采集的图像信息输入;
S2)对输入的图像信息进行预处理,并利用SIFT方法处理图像信息区域进行初步定位;
具体步骤为:
S2.1)采用特征点匹配算法将输入的图像信息转化为矩阵,
S2.2)通过构建尺度空间和高斯空间差分金字塔,计算极值点和相应的坐标,
S2.3)根据S2.2)得到所有的极值点判别和定位特殊符号在图像信息中的大致坐标并提取对应的图像区域,完成初步定位;
S3)根据S2)得到初步定位的结果再次进行精确定位;
具体为:S3.1)将经过S2.3)初步定位的结果输入CRAFT深度学习检测模型,
S3.2)利用CRAFT深度学习检测模型计算得到图像信息中包含普通文本区域和特殊符号区域的区域坐标,提取所述区域坐标内的图像信息并提取对应图像的方向梯度直方图特征,
S3.3)根据S3.2)得到梯度直方图特征利用SVM向量机对梯度直方图进行二分类,分为普通文本区域和特殊符号区域;
S4)对S3)得到精确定位结果进行图像信息区域识别,并对识别后的结果进行分类,得到普通文本区域和特殊符号区域;
S5)将S4)得到普通文本区域和特殊符号区域分别输入特殊符号识别模型和普通文本识别模型进行识别;
S6)对识别后结果进行汇总和结构化输出;其特征在于,所述S4)的具体步骤为:
S4.1)先将S3.3)得到的普通文本区域输入训练后的普通文本识别模型进行识别,并输出识别结果;
S4.2)再将S3.3)得到的特殊符号区域输入训练后的特殊符号识别模型进行识别,并输出识别结果;
所述文本识别模型和特殊符号识别模型训练的具体步骤为:
步骤1:将标记百万级图片内的文本内容作为网络模型的训练集;
步骤2:对所述训练集内所有待训练图片做统一处理,转化为值域为[-1,1]的矩阵;
步骤3:再将所述训练集内所有待训练图片随机分成若干组, 将分组后的图片与步骤2:得到的矩阵按照所述分组进行组合,得到batch批次;
步骤4:将步骤3得到的batch批次输入到对应的识别模型的输入层中,在输出层中比较输出结果和样本标签实际值的误差计算最终值;
步骤5:若输出层经过CTC算法处理之后的输出结果和实际标签结果差别较小则执行步骤7,否则执行步骤6;
步骤6:更新当前对应的卷积神经识别模型的隐层中各神经元的网络权值和阈值,使网络误差函数沿负梯度方向下降,使输出结果逼近期望输出,然后返回步骤4;
步骤7:即得到训练后的普通文本识别模型和特殊符号识别模型。
2.根据权利要求1所述的方法,其特征在于,所述步骤2中的统一处理方式包括灰度化或二值化。
3.一种实现如权利要求1-2任一项所述的低像素密度文本的识别方法的信息处理终端。
4.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1-2任意一项所述的低像素密度文本的识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于民生科技有限责任公司,未经民生科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010190222.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:涨壳式新型注浆锚杆装置
- 下一篇:一种车辆管理的方法、装置、设备及存储介质





