[发明专利]一种高准确率的图片中文本的智能识别方法在审
申请号: | 202210318732.X | 申请日: | 2022-03-29 |
公开(公告)号: | CN114882508A | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 高强;丁昊 | 申请(专利权)人: | 苏州清苏数据信息有限公司 |
主分类号: | G06V30/19 | 分类号: | G06V30/19;G06V30/262;G06V10/776;G06V30/413;G06V10/75 |
代理公司: | 深圳峰诚志合知识产权代理有限公司 44525 | 代理人: | 王红印 |
地址: | 215321 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 准确率 图片 文本 智能 识别 方法 | ||
本发明公开了一种高准确率的图片中文本的智能识别方法,具体包括以下步骤:步骤一、特征存储;步骤二、语句整合;步骤三、目标采集;步骤四、结果整合;本发明涉及图片文本识别技术领域。该高准确率的图片中文本的智能识别方法,通过笔画类型和字体垂直投影来进行图片中文本的识别判断,并且经过双重检测的方式得到精确的文字和笔画目标,在经过二次相似度对比和词组语句关联度的对比后,筛选出对应的文字,识别精度提高的同时,有效保证了图片中文本识别具有更高的准确率,将文本中检测不到对应词组语句的情况向用户发出通知,并且给用户操作空间,可以很好的向用户发出对应位置的重点检查,保证最终文本识别的精准有效。
技术领域
本发明涉及图片文本识别技术领域,具体为一种高准确率的图片中文本的智能识别方法。
背景技术
人工智能和图像处理技术领域中,文本识别技术是一项重要的技术手段,目前可以通过联机或者脱机的方式,提取文本中每个字符的笔画、轮廓、特征角等几何特征,采用模板匹配的方式,计算各字符特征与提取的几何特征之间的距离,将距离最近的字符特征所对应的字符作为文本识别结果,采用这种方式进行文本识别时,往往只能适用于标准打印字体,对于用户手写的文本,很难提取到所需的几何特征,往往导致文本识别准确率较低,为此,特提出一种高准确率的图片中文本的智能识别方法,通过笔画类型和字体垂直投影来进行图片中文本的识别判断,并且经过双重检测的方式得到精确的文字和笔画目标,在经过二次相似度对比和词组语句关联度的对比后,筛选出对应的文字,识别精度提高的同时,有效保证了图片中文本识别具有更高的准确率。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种高准确率的图片中文本的智能识别方法,解决了常规的文本识别对于用户手写的文本,文本识别准确率较低的问题。
(二)技术方案
为实现上述目的,本发明提供了如下技术方案:一种高准确率的图片中文本的智能识别方法,具体包括以下步骤:
步骤一、特征存储:利用特征存储单元对不同字体类型产生的垂直投影进行特征提取,并对字体进行笔画特征提取,按照字体类型对字体垂直投影及对应的笔画特征进行分类存储;
步骤二、语句整合:利用语句整合单元对词组语句进行收集并单机存储,在检测不到对应的词组语句时,向用户发出询问,待用户确定后,进行联网,从云端检索对应的词组语句,并将检索到的词组语句进行单机存储;
步骤三、目标采集:通过目标采集单元设定步骤一中存储的字体垂直投影为目标,并在训练数据集中补充步骤一中存储的对应笔画特征,作为笔画特征目标,训练深度学习模型,利用摄像机对含有文本的图片进行图像转换,并通过目标采集单元按照文字目标对转换后的图像进行第一次目标检测,得到对应的文字区域画面,随后按照笔画特征目标对文字区域画面进行第二次目标检测,进行所属字体的对应笔画特征验证;
步骤四、结果整合:通过特征存储单元对步骤三中得到的文字区域影像和步骤一中的字体垂直投影进行对比,等比例缩放后按照重合度进行相似度计算,并对不同字体类型的重合度进行相似度计算排序,随后将步骤三中验证后的笔画特征与步骤一中存储的笔画特征进行对比,并按照笔画特征重合度进行相似度计算,随后按照笔画特征对所属字体对应的垂直投影与相似度较高排序位对应的字体垂直投影进行差异比较,并进行二次相似度计算,利用结果整合单元进行差异比较后的相似度进行从高到低的排序,通过目标采集单元选取相似度排名前列的字按照图像中对应的位置进行词组语句排列,并通过语句整合单元中存储的词组语句对排列的词组语句进行对比验证,通过结果整合单元对验证后词组语句的重合度进行关联度计算,并进行关联度排序,选择二次相似度排序第一和关联度第一对应的字作为识别出来的文本。
通过采用上述技术方案,通过笔画类型和字体垂直投影来进行图片中文本的识别判断,并且经过双重检测的方式得到精确的文字和笔画目标,在经过二次相似度对比和词组语句关联度的对比后,筛选出对应的文字,识别精度提高的同时,有效保证了图片中文本识别具有更高的准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州清苏数据信息有限公司,未经苏州清苏数据信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210318732.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:矿用推车机自动换向机构
- 下一篇:一种钢构坝的坝、道、桥综合施工体系