[发明专利]一种文本定位方法及电子设备在审
| 申请号: | 202210466576.1 | 申请日: | 2022-04-29 |
| 公开(公告)号: | CN115082932A | 公开(公告)日: | 2022-09-20 |
| 发明(设计)人: | 高磊;周健;燕鹏举;张泉 | 申请(专利权)人: | 上海弘玑信息技术有限公司 |
| 主分类号: | G06V30/146 | 分类号: | G06V30/146;G06V30/19 |
| 代理公司: | 江苏瑞途律师事务所 32346 | 代理人: | 李维朝;计璐 |
| 地址: | 200000 上海市闵*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 文本 定位 方法 电子设备 | ||
1.一种文本定位方法,其特征在于,包括:
接收目标图像和目标字符串;
定位所述目标图像内原始文本元素的位置,识别所述原始文本元素中的可识别字符串;
根据所述目标字符串和所述原始文本元素中的可识别字符串,从所述原始文本元素中筛选出目标文本元素;
计算所述目标文本元素字符串与所述目标字符串之间的字符串相似度,获取相似度最高的目标文本元素;
确定相似度最高目标文本元素的最小外接矩形框。
2.根据权利要求1所述的一种文本定位方法,其特征在于,所述原始文本元素包括第一聚合文本元素和第一非聚合文本元素,其中,
在从所述原始文本元素中筛选出目标文本元素前,对相邻的原始文本元素进行聚合,形成第一聚合文本元素。
3.根据权利要求1所述的一种文本定位方法,其特征在于,所述目标文本元素包括第二聚合文本元素和第二非聚合文本元素,其中,
在从所述原始文本元素中筛选出目标文本元素后,对相邻的目标文本元素进行聚合,形成第二聚合文本元素。
4.根据权利要求2所述的一种文本定位方法,其特征在于,所述相邻的原始文本元素是在所述目标图像中处于同一水平线或同一垂直线且间隔小于阈值的原始文本元素。
5.根据权利要求3所述的一种文本定位方法,其特征在于,所述相邻的目标文本元素是在所述目标图像中处于同一水平线或同一垂直线且间隔小于阈值的目标文本元素。
6.根据权利要求2所述的一种文本定位方法,其特征在于,所述计算所述目标文本元素字符串与所述目标字符串之间的字符串相似度,获取相似度最高的目标文本元素后,还包括:
剔除对所述目标文本元素字符串与目标字符串之间相似度没有影响的原始文本元素。
7.根据权利要求3所述的一种文本定位方法,其特征在于,所述计算所述目标文本元素字符串与所述目标字符串之间的字符串相似度,获取相似度最高的目标文本元素,包括:
计算所述第二聚合文本元素字符串与所述目标字符串之间的字符串相似度,获取相似度最高的聚合文本元素,剔除对第二聚合文本元素字符串与目标字符串之间相似度没有影响的原始文本元素。
8.根据权利要求1所述的一种文本定位方法,其特征在于,所述定位所述目标图像内原始文本元素的位置,包括:
获取原始文本元素的坐标信息(x,y,w,h),(x,y)表示矩形框的左上点坐标,w是该矩形框的宽,h是该矩形框的高。
9.根据权利要求2或3所述的一种文本定位方法,其特征在于,原始文本元素聚合为所述第一聚合文本元素,或目标文本元素聚合为所述第二聚合文本元素后,确认第一聚合文本元素或第二文本元素的坐标信息(x0,y0,w0,h0),(x0,y0)表示第一聚合文本元素或第二聚合文本元素矩形框的左上点坐标,w0是该矩形框的宽,h0是该矩形框的高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海弘玑信息技术有限公司,未经上海弘玑信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210466576.1/1.html,转载请声明来源钻瓜专利网。





