[发明专利]POI名称的生成方法、装置、电子设备和存储介质在审
| 申请号: | 202211216873.7 | 申请日: | 2022-09-30 |
| 公开(公告)号: | CN115984838A | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 倪子涵;安容巧;孙逸鹏;姚锟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/41;G06V30/24;G06V30/19;G06V10/82;G06N3/0464;G06N3/09 |
| 代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 罗朗 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | poi 名称 生成 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种POI名称的生成方法、装置、电子设备和存储介质,该方法包括:获取待处理图像;将所述待处理图像输入至预设POI生成模型,以输出N维度的POI关联信息;其中,N≥2且取整数;基于N维度的所述POI关联信息,生成所述待处理图像中的POI名称。本公开中预设文字方向检测、识别内容、语义分类在同一个模型中端到端训练,减少中间步骤带来的累积误差,提升POI名称获取模型的精度,进一步提升检测、识别、分类的准确度;且该端到端的模型可以适配到预设文字方向检测、预设文字方向识别、文本语义分类多个任务上,无需引入多个模型,有效简化了从图像中提取POI名称的处理流程,提高整体的处理效率。
技术领域
本公开涉及图像处理技术领域,特别涉及一种POI(兴趣点)名称的生成方法、装置、电子设备和存储介质。
背景技术
POI名称识别处理,是对图像中(如门店招牌图像)上的众多文字进行信息结构化,并将所有属于店名的预设文字方向按照正确顺序排列以构成对应的POI名称。其中,对于从门店图像提取出POI名称是地图数据生成、门店拜访管理等技术的重要技术之一。
目前,常用的POI名称生成方案一般都是人工录入,但该方案对于企业而言非常低效、成本高且无法保证准确率。随着深度学习的发展,目前涌现一些基于深度学习的技术方案,比较常见的是:需要先用预设文字方向检测与预设文字方向识别相结合以获取预设文字方向内容,再利用BERT模型(一种机器学习算法)对文本内容进行语义分类;再结合图像特征和文本特征联合进行语义分类;但是该方案存在没有利用视觉特征,依赖文本识别的准确性,鲁棒性较差;另外实现方式依赖输入的预设文字方向位置以及识别内容的准确性,且所有预设文字方向的文字特征是串行解码,耗时较大等缺陷。
发明内容
本公开要解决的技术问题是为了克服现有技术中对图像中POI名称的提取方式存在准确度较差、过程复杂、耗时较多等缺陷,提供一种POI名称的生成方法、装置、电子设备和存储介质。
本公开是通过下述技术方案来解决上述技术问题:
本公开第一方面提供一种POI名称的生成方法,其特征在于,所述生成方法包括:
获取待处理图像;
将所述待处理图像输入至预设POI生成模型,以输出N维度的POI关联信息;其中,N≥2且取整数;
基于N维度的所述POI关联信息,生成所述待处理图像中的POI名称。
较佳地,所述POI关联信息包括所述待处理图像中每个预设文字方向所在位置的位置区域信息、文字内容信息或文字语义类别信息。
较佳地,所述将待处理图像输入至预设POI生成模型,以输出N维度的POI关联信息的步骤包括:
基于所述预设POI生成模型提取得到所述待处理图像对应的目标高层语义特征;
基于所述目标高层语义特征,输出N维度的所述POI关联信息。
较佳地,所述基于所述目标高层语义特征,输出N维度的所述POI关联信息的步骤包括:
基于所述目标高层语义特征确定所述待处理图像中不同的目标预设文字方向以及对应的所述位置区域信息;
基于所述位置区域信息获取对应的所述目标预设文字方向的文字序列化特征;
根据所述文字序列化特征获取所述目标预设文字方向对应的所述文字内容信息;
基于所述位置区域信息和所述文字序列化特征,获取所述目标预设文字方向对应的所述文字语义类别信息。
较佳地,所述基于所述预设POI生成模型提取得到所述待处理图像对应的目标高层语义特征的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211216873.7/2.html,转载请声明来源钻瓜专利网。





