[发明专利]根据图像中的文字进行地点识别的方法、装置及应用在审
申请号: | 202310347336.4 | 申请日: | 2023-03-28 |
公开(公告)号: | CN116363639A | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 王国梁;毛云青;陈娜华;韩致远 | 申请(专利权)人: | 城云科技(中国)有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V20/70;G06V30/19;G06V30/164 |
代理公司: | 杭州汇和信专利代理有限公司 33475 | 代理人: | 陈江 |
地址: | 310052 浙江省杭州市滨江区长*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 根据 图像 中的 文字 进行 地点 识别 方法 装置 应用 | ||
1.一种根据图像中的文字进行地点识别的方法,其特征在于,包括以下步骤:
获取目标区域的区域拓扑图,其中所述区域拓扑图的每一个拓扑节点表示当前目标区域内的一个地点图像以及所述地点图像对应的区域文本描述符,所述区域文本描述符描述所述地点图像内表示区域文字信息的文本以及区域文字信息的边界框位置信息;
获取待确定地点的至少一包含区域文字信息的待检测图像,将每一所述待检测图像转换为对应的待检测文本描述符,所述待检测的图像和对应的待检测文本描述符作为一个待检测节点;
比对所述待检测节点和所述区域拓扑图的拓扑节点,获取相似度最大的拓扑节点对应的地点图像作为所述待确定地点的地点。
2.根据权利要求1所述的一种根据图像中的文字进行地点识别的方法,其特征在于,在“获取目标区域的区域拓扑图”步骤中,划定目标区域,获取所述目标区域内的所有地点图像,将每一所述地点图像转换为对应的区域文本描述符,根据所述目标区域内的地点图像以及对应的区域文本描述符构建所述区域拓扑图。
3.根据权利要求1所述的一种根据图像中的文字进行地点识别的方法,其特征在于,根据所述目标区域内的区域文字信息维护一个区域地点字典,所述区域地点字典中包括每一区域文字信息的字符串表示形式。
4.根据权利要求3所述的一种根据图像中的文字进行地点识别的方法,其特征在于,在“获取待确定地点的至少一包含区域文字信息的待检测图像,将每一所述待检测图像转换为对应的待检测文本描述符”步骤中,将所述待检测图像中的区域文字信息与所述区域地点字典中的区域文字信息进行比对过滤,得到过滤后待检测图像,将所述过滤后待检测图像转换为对应的待检测文本描述符。
5.根据权利要求1所述的一种根据图像中的文字进行地点识别的方法,其特征在于,在“比对所述待检测节点和所述区域拓扑图的拓扑节点,获取相似度最大的拓扑节点对应的地点图像作为所述待确定地点的地点”步骤中,计算所述待检测节点与所述区域拓扑图中的每一拓扑节点的节点编辑距离,设定编辑距离阈值,当所述节点编辑距离小于编辑距离阈值时,计算待检测节点与对应拓扑节点的边界框交并比,所述待检测节点与对应拓扑节点的相似度为所述节点编辑距离与所述边界框交并比的加权结果。
6.根据权利要求1所述的一种根据图像中的文字进行地点识别的方法,其特征在于,若获取多张待检测图像,则得到多个待检测节点,使用所述待检测节点构建查询序列,在所述区域拓扑图中生成搜索窗口,所述搜索窗口包含的拓扑节点数量与所述待检测节点的数量相同,所述搜索窗口的节点为映射节点。
7.根据权利要求6所述的一种根据图像中的文字进行地点识别的方法,其特征在于,计算所述查询序列中的每一待检测节点与所述映射序列中的每一拓扑节点的节点编辑距离,根据所述节点编辑距离在所述映射序列中得到与每一待检测节点对应的拓扑节点,对所述查询序列与所述映射序列中每一对节点的节点编辑距离进行归一化得到序列编辑距离,若所述序列编辑距离小于设定阈值,则计算所述查询序列与所述映射序列中每一对节点边界框的交并比,将每一对节点边界框的交并比进行归一化得到序列边界框交并比,所述查询序列和所述映射序列之间的相似度为所述序列编辑距离和所述序列边界框交并比的加权结果。
8.一种根据图像中的文字进行地点识别的装置,其特征在于,包括:
获取模块:获取目标区域的区域拓扑图,其中所述区域拓扑图的每一个拓扑节点表示当前目标区域内的一个地点图像以及所述地点图像对应的区域文本描述符,所述区域文本描述符描述所述地点图像内表示区域文字信息的文本以及区域文字信息的边界框位置信息;
转换模块:获取待确定地点的至少一包含区域文字信息的待检测图像,将每一所述待检测图像转换为对应的待检测文本描述符,所述待检测的图像和对应的待检测文本描述符作为一个待检测节点;
识别模块:比对所述待检测节点和所述区域拓扑图的拓扑节点,获取相似度最大的拓扑节点对应的地点图像作为所述待确定地点的地点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于城云科技(中国)有限公司,未经城云科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310347336.4/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序