[发明专利]图片文字定位方法、装置、计算机设备和存储介质有效
| 申请号: | 201911183212.7 | 申请日: | 2019-11-27 |
| 公开(公告)号: | CN110880000B | 公开(公告)日: | 2022-09-02 |
| 发明(设计)人: | 王晓珂 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
| 主分类号: | G06V30/146 | 分类号: | G06V30/146;G06V30/18;G06V10/54;G06V10/82;G06V30/41 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张振军 |
| 地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图片 文字 定位 方法 装置 计算机 设备 存储 介质 | ||
1.一种图片文字定位方法,其特征在于,所述方法包括:
获取目标图片,所述目标图片中包括待识别文字;
通过将所述目标图片输入纹理提取模型中,以得到所述目标图片不同特征维度的若干个纹理特征层,所述纹理提取模型是根据历史图像中的纹理特征进行分析得到的、用以提取输入的图片中的纹理特征层的模型;其中,纹理特征与图片中的文字分布相对应,特征维度为对图片中文字所在区域进行识别的维度;
从所述若干个纹理特征层中筛选出基础纹理特征层;所述基础纹理特征层为所述若干个纹理特征层中对于文字定位效果最好的几层,每一所述基础纹理特征层包括与所述待识别文字对应的特征矩阵;
将所述基础纹理特征层通过核为1×1,通道为128的卷积层进行卷积;
将所述基础纹理特征层进行特征叠加,得到所述待识别文字的纹理特征层,包括:
将所述基础纹理特征层按照特征矩阵的维度从大到小的顺序进行排序;
将排序后的所述基础纹理特征层通过上采样依次叠加,得到所述待识别文字的纹理特征层;
对所述待识别文字的纹理特征层进行特征加深,包括:将所述待识别文字的纹理特征层通过核为3×3,通道为128的卷积层进行卷积,得到第一卷积层;将所述第一卷积层通过核为1×1,通道为6的卷积层进行卷积;
对加深后的所述待识别文字的纹理特征层进行分割,得到所述待识别文字在所述目标图片中的位置。
2.根据权利要求1所述的方法,其特征在于,所述对加深后的所述待识别文字的纹理特征层进行分割,包括:
利用PSE网络,对加深后的所述待识别文字的纹理特征层进行分割。
3.根据权利要求1所述的方法,其特征在于,所述纹理提取模型为mobilenetv2网络。
4.一种图片文字定位装置,其特征在于,所述装置包括:
目标图片获取模块,用于获取目标图片,所述目标图片中包括待识别文字;特征提取模块,用于通过将所述目标图片输入纹理提取模型中,以得到所述目标图片的若干个纹理特征层,所述纹理提取模型是根据历史图像中的纹理特征进行分析得到的、用以提取输入的图片中的纹理特征层的模型;其中,纹理特征与图片中的文字分布相对应,特征维度为对图片中文字所在区域进行识别的维度;
基础纹理特征层筛选模块,用于从所述若干个纹理特征层中筛选出基础纹理特征层;所述基础纹理特征层为所述若干个纹理特征层中对于文字定位效果最好的几层,每一所述基础纹理特征层包括与所述待识别文字对应的特征矩阵;将所述基础纹理特征层通过核为1×1,通道为128的卷积层进行卷积;特征叠加模块,用于将所述基础纹理特征层进行特征叠加,得到所述待识别文字的纹理特征层,包括:将所述基础纹理特征层按照特征矩阵的维度从大到小的顺序进行排序;将排序后的所述基础纹理特征层通过上采样依次叠加,得到所述待识别文字的纹理特征层;
定位模块,用于对所述待识别文字的纹理特征层进行特征加深,包括:将所述待识别文字的纹理特征层通过核为3×3,通道为128的卷积层进行卷积,得到第一卷积层;将所述第一卷积层通过核为1×1,通道为6的卷积层进行卷积;对加深后的所述待识别文字的纹理特征层进行分割,得到所述待识别文字在所述目标图片中的位置。
5.一种计算机设备,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机指令,其特征在于,所述处理器运行所述计算机指令时执行权利要求1至3任一项所述方法的步骤。
6.一种存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1至3任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911183212.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种虚拟化实现的方法和设备
- 下一篇:一种轴端连接装置、轮对组成及铁路车辆





