[发明专利]用于直接从图像识别实体的系统和方法有效
申请号: | 201680079105.8 | 申请日: | 2016-12-08 |
公开(公告)号: | CN108463821B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | Q.于;L.雅茨夫;Y.李;C.塞格德;S.C.阿诺德;M.C.史坦伯 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06V10/74;G06V20/62;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 直接 图像 识别 实体 系统 方法 | ||
公开了识别实体的系统和方法。特别地,可以从多个图像中识别描绘实体的一个或多个图像。可以至少部分地基于描绘实体的一个或多个图像,从实体目录中确定一个或多个候选实体简档。可以提供该描绘实体的一个或多个图像和一个或多个候选实体简档作为对机器学习模型的输入。可以生成机器学习模型的一个或多个输出。每个输出可以包括与描绘实体的图像和至少一个候选实体简档相关联的匹配分数。可以至少部分地基于机器学习模型的一个或多个生成的输出来更新实体目录。
技术领域
本公开一般涉及更新实体列表,并且更具体地涉及使用描绘实体的一个或多个图像来更新实体列表。
背景技术
地理信息系统一般包括与多个实体(例如,企业、餐馆、兴趣点、地标等)相关联的信息。例如,这种关联信息可以包括姓名、电话号码、定位、类别URL(uniform resourcelocator,统一资源定位符)、电子邮件地址、街道地址、营业时间、和/或与实体相关联的其它信息。这种信息可以存储在具有与一个或多个实体相关联的一个或多个实体简档的实体目录中。填充实体目录的传统技术可以包括将信息手动输入到实体简档中。
其它技术可以包括将描绘实体的一个或多个图像与对应的实体简档匹配,并且至少部分地基于与图像相关联的信息来填充实体简档。例如,可以对描绘实体的店面(storefront)的图像执行光学字符识别(optical character recognition,OCR)或其它技术,以确定与实体相关联的信息。然后可以至少部分地基于所确定的信息将实体与实体简档匹配。
这种OCR技术可能是不可靠的。例如,OCR图像可能包含一个或多个特征或缺陷,这些特征或缺陷导致不准确地转录图像中所描绘的文本。例如,图像可能包括店面的遮挡视图、模糊问题、缝合问题等。作为另一示例,店面可能包括难以使用OCR转录的标牌。例如,标牌可能拥挤或杂乱,或者标牌可能包括难以转录的“花式”字体。
发明内容
本公开的实施例的方面和优点将在以下描述中部分地阐述,或者可以从描述获知,或者可以通过实施例的实践来学习。
本公开的一个示例方面针对识别实体的计算机实施方法。该方法包括由一个或多个计算设备从多个图像识别描绘实体的一个或多个图像。该方法还包括由一个或多个计算设备至少部分地基于描绘实体的一个或多个图像从实体目录中确定一个或多个候选实体简档。该方法还包括由一个或多个计算设备提供描绘实体的一个或多个图像和一个或多个候选实体简档作为对机器学习模型的输入。该方法还包括由一个或多个计算设备生成机器学习模型的一个或多个输出。每个输出包括与描绘实体的图像和至少一个候选实体简档相关联的匹配分数。该方法还包括由一个或多个计算设备至少部分地基于机器学习模型的一个或多个生成的输出来更新实体目录。
本文描述的方法提供了用图像数据填充实体目录的增强装置,并且可以帮助克服当使用传统装置实现目标时遇到的问题。使用机器学习模型可以,例如,消除对数据的手动输入的需要,并且还有助于将图像或图像对象识别为与不同实体相关联,其中如果使用OCR技术作为将图像与特定实体匹配的唯一手段,则这种关联不一定显而易见。因此,本文描述的方法可以允许输入更大范围的图像并将其用于填充目录。
本公开的其它示例方面针对用于识别实体的系统、装置、有形、非暂时性计算机可读介质、用户界面、存储器设备、和电子设备。
参考以下描述和所附权利要求,将更好地理解各种实施例的这些和其它特征、方面、和优点。并入本说明书中并构成其部分的附图示出了本公开的实施例,并且与说明书一起用于解释相关原理。
附图说明
在说明书中参考附图阐述了针对本领域普通技术人员的实施例的详细讨论,其中:
图1描绘了根据本公开的示例实施例的示例机器学习网络。
图2描绘了根据本公开的示例实施例的示例图像和由图像描绘的检测到的实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680079105.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序