[发明专利]图片文字定位方法、装置、计算机设备和存储介质有效
| 申请号: | 201911183212.7 | 申请日: | 2019-11-27 |
| 公开(公告)号: | CN110880000B | 公开(公告)日: | 2022-09-02 |
| 发明(设计)人: | 王晓珂 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
| 主分类号: | G06V30/146 | 分类号: | G06V30/146;G06V30/18;G06V10/54;G06V10/82;G06V30/41 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张振军 |
| 地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图片 文字 定位 方法 装置 计算机 设备 存储 介质 | ||
一种图片文字定位方法、装置、计算机设备和存储介质,该图片文字定位方法包括:获取目标图片,目标图片中包括待识别文字;通过将目标图片输入纹理提取模型中,以得到目标图像的若干个纹理特征层,纹理提取模型是根据历史图像中的纹理特征进行分析得到的、用以提取输入的图片中的纹理特征层的模型;从若干个纹理特征层中筛选出基础纹理特征层;将基础纹理特征层进行特征叠加,得到待识别文字的纹理特征层;根据待识别文字的纹理特征层获取待识别文字在目标图片中的位置。通过此方法,耗时短且准确性高。
技术领域
本发明涉及计算机技术领域,具体地涉及一种图片文字定位方法、装置、计算机设备和存储介质。
背景技术
随着互联网图片内容的不断增加,以及办公扫描打印文件的日益增加,常需要将扫描打印的图片转化为文字信息,因而如何实现高效的文字识别和检测,以快速完成扫描打印的图片中文字转化成为一个亟需解决的问题。目前常见的文字识别和检测方案一般包含文字定位和识别两部分,文字行定位的准确性、效率性与文字识别的准确性呈线性正比关系。
现有的文字行定位方法分两大类:基于锚点(Anchors)的行定位方法和基于分割的行定位方法。其中,基于锚点的行定位方法的缺点是感受野会限制检测内容的长短,若检测内容与感受野不匹配,则可能影响文字定位的准确性。而基于分割的行定位方法则需要引入大量数据进行模型训练或数据分析,需要耗费大量的时间。因而,若能提供一种耗时短且准确性高的图片文字定位方法,将能够有效提高扫描打印的图片中文字转化的效率性和准确性。
发明内容
本发明解决的技术问题是如何提供一种耗时短且准确性高的图片文字定位方法。
为解决上述技术问题,本发明实施例提供一种图片文字定位方法,所述方法包括:获取目标图片,所述目标图片中包括待识别文字;通过将所述目标图片输入纹理提取模型中,以得到所述目标图像的若干个纹理特征层,所述纹理提取模型是根据历史图像中的纹理特征进行分析得到的、用以提取输入的图片中的纹理特征层的模型;从所述若干个纹理特征层中筛选出基础纹理特征层;将所述基础纹理特征层进行特征叠加,得到所述待识别文字的纹理特征层;根据所述待识别文字的纹理特征层获取所述待识别文字在所述目标图片中的位置。
可选的,每一所述基础纹理特征层包括与所述待识别文字对应的特征矩阵,所述将所述基础纹理特征层进行特征叠加,得到所述待识别文字的纹理特征层,包括:将所述基础纹理特征层按照特征矩阵的维度从大到小的顺序进行排序;将排序后的所述基础纹理特征层通过上采样依次叠加,得到所述待识别文字的纹理特征层。
可选的,所述根据所述待识别文字的纹理特征层获取所述待识别文字在所述目标图片中的位置,包括:对所述待识别文字的纹理特征层进行特征加深;对加深后的所述待识别文字的纹理特征层进行分割,得到所述待识别文字在所述目标图片中的位置。
可选的,所述对所述待识别文字的纹理特征层进行特征加深,包括:将所述待识别文字的纹理特征层通过核为3×3,通道为128的卷积层进行卷积,得到第一卷积层;将所述第一卷积层通过核为1×1,通道为6的卷积层进行卷积。
可选的,所述对加深后的所述待识别文字的纹理特征层进行分割,包括:利用PSE网络,对加深后的所述待识别文字的纹理特征层进行分割。
可选的,所述将所述基础纹理特征层进行特征叠加之前,还包括:对所述基础纹理特征层进行特征加深;所述对所述基础纹理特征层进行特征加深,包括:将所述基础纹理特征层通过核为1×1,通道为128的卷积层进行卷积。
可选的,所述纹理提取模型为mobilenetv2网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911183212.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种虚拟化实现的方法和设备
- 下一篇:一种轴端连接装置、轮对组成及铁路车辆





