[发明专利]一种高准确率的图片中文本的智能识别方法在审
申请号: | 202210318732.X | 申请日: | 2022-03-29 |
公开(公告)号: | CN114882508A | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 高强;丁昊 | 申请(专利权)人: | 苏州清苏数据信息有限公司 |
主分类号: | G06V30/19 | 分类号: | G06V30/19;G06V30/262;G06V10/776;G06V30/413;G06V10/75 |
代理公司: | 深圳峰诚志合知识产权代理有限公司 44525 | 代理人: | 王红印 |
地址: | 215321 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 准确率 图片 文本 智能 识别 方法 | ||
1.一种高准确率的图片中文本的智能识别方法,其特征在于:具体包括以下步骤:
步骤一、特征存储:利用特征存储单元(1)对不同字体类型产生的垂直投影进行特征提取,并对字体进行笔画特征提取,按照字体类型对字体垂直投影及对应的笔画特征进行分类存储;
步骤二、语句整合:利用语句整合单元(2)对词组语句进行收集并单机存储,在检测不到对应的词组语句时,向用户发出询问,待用户确定后,进行联网,从云端检索对应的词组语句,并将检索到的词组语句进行单机存储;
步骤三、目标采集:通过目标采集单元(3)设定步骤一中存储的字体垂直投影为目标,并在训练数据集中补充步骤一中存储的对应笔画特征,作为笔画特征目标,训练深度学习模型,利用摄像机对含有文本的图片进行图像转换,并通过目标采集单元(3)按照文字目标对转换后的图像进行第一次目标检测,得到对应的文字区域画面,随后按照笔画特征目标对文字区域画面进行第二次目标检测,进行所属字体的对应笔画特征验证;
步骤四、结果整合:通过特征存储单元(1)对步骤三中得到的文字区域影像和步骤一中的字体垂直投影进行对比,等比例缩放后按照重合度进行相似度计算,并对不同字体类型的重合度进行相似度计算排序,随后将步骤三中验证后的笔画特征与步骤一中存储的笔画特征进行对比,并按照笔画特征重合度进行相似度计算,随后按照笔画特征对所属字体对应的垂直投影与相似度较高排序位对应的字体垂直投影进行差异比较,并进行二次相似度计算,利用结果整合单元(4)进行差异比较后的相似度进行从高到低的排序,通过目标采集单元(3)选取相似度排名前列的字按照图像中对应的位置进行词组语句排列,并通过语句整合单元(2)中存储的词组语句对排列的词组语句进行对比验证,通过结果整合单元(4)对验证后词组语句的重合度进行关联度计算,并进行关联度排序,选择二次相似度排序第一和关联度第一对应的字作为识别出来的文本。
2.根据权利要求1所述的一种高准确率的图片中文本的智能识别方法,其特征在于:所述特征存储单元(1)包括字体特征提取模块(5)、字体分类存储模块(6)、数据比较模块(7)和字体融合模块(8),所述字体特征提取模块(5)与字体分类存储模块(6)对接,所述字体分类存储模块(6)与数据比较模块(7)对接,所述数据比较模块(7)与字体融合模块(8)对接。
3.根据权利要求2所述的一种高准确率的图片中文本的智能识别方法,其特征在于:所述字体特征提取模块(5)用于对不同字体类型产生的垂直投影进行特征提取,并对字体进行笔画特征提取;
所述字体分类存储模块(6)用于按照字体类型对字体垂直投影及对应的笔画特征进行分类存储;
所述数据比较模块(7)用于对目标采集单元(3)中得到的文字区域影像和特征存储单元(1)中的字体垂直投影进行对比,等比例缩放后按照重合度进行相似度计算,并对不同字体类型的重合度进行相似度计算排序,将目标采集单元(3)中验证后的笔画特征与特征存储单元(1)中存储的笔画特征进行对比,并按照笔画特征重合度进行相似度计算;
所述字体融合模块(8)用于按照笔画特征对所属字体对应的垂直投影与相似度较高排序位对应的字体垂直投影进行差异比较,并进行二次相似度计算。
4.根据权利要求1所述的一种高准确率的图片中文本的智能识别方法,其特征在于:所述语句整合单元(2)包括本地存储模块(9)、缺失联网模块(10)和云端检索模块(11),所述本地存储模块(9)与缺失联网模块(10)对接,所述缺失联网模块(10)与云端检索模块(11)对接,所述云端检索模块(11)与本地存储模块(9)对接。
5.根据权利要求4所述的一种高准确率的图片中文本的智能识别方法,其特征在于:所述本地存储模块(9)用于对词组语句进行收集并单机存储,并与目标采集单元(3)排列的词组语句进行对比验证;
所述缺失联网模块(10)用于在检测不到对应的词组语句时,向用户发出询问,待用户确定后,进行联网;
所述云端检索模块(11)用于从云端检索对应的词组语句,并将检索到的词组语句存储到本地存储模块(9)中进行单机存储。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州清苏数据信息有限公司,未经苏州清苏数据信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210318732.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:矿用推车机自动换向机构
- 下一篇:一种钢构坝的坝、道、桥综合施工体系