[发明专利]精细化图像识别在审
申请号: | 201710592777.5 | 申请日: | 2017-07-19 |
公开(公告)号: | CN109284749A | 公开(公告)日: | 2019-01-29 |
发明(设计)人: | 傅建龙;梅涛 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;罗利娜 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关注区域 局部特征 子网络 全局特征 图像识别 精细化 图像 尺度 精细 对象识别 提取图像 图像区域 准确定位 网络 辨识 学习 | ||
根据本公开的实现,提出了一种精细化图像识别的方案。在该方案中,利用第一学习网络的第一子网络提取图像的全局特征;利用第一学习网络的第二子网络、基于全局特征确定图像的第一关注区域,第一关注区域包括图像中对象的可辨识部分;利用第二学习网络的第一子网络提取第一关注区域的第一局部特征;以及至少部分基于第一局部特征确定图像中的对象的类别。通过该方案,实现了对于更精细尺度的图像区域的准确定位,从而可以获得基于精细尺度上的局部特征用于对象识别。
背景技术
由计算机技术来识别图像的细化类别一直受到广泛关注。精细化图像识别的示例包括但不限于划分各种生物的具体类别、各种商品的品牌和型号、医学上的细胞类型等等。某些细化类别中的对象可能仅能够由领域专家分辨出他们之间的细微差距。例如,有些鸟类的整体特征相似,区别仅在于某个部位的颜色、纹路、型态等等。与一般类别的识别(例如仅区分鸟、花、汽车等整体差异较大的对象类别)相比,精细化图像识别需要定位出不同细化类别的对象中具有细微视觉差异的区域并且准确表征该区域的特征。精细化图像识别可以被应用在多种多样的场景中,例如专家级图像识别、丰富图像采集、医学诊断等等。
发明内容
根据本公开的实现,提出了一种用于精细化图像识别的方案。在该方案中,利用第一学习网络的第一子网络提取图像的全局特征;利用第一学习网络的第二子网络、基于全局特征确定图像的第一关注区域,第一关注区域包括图像中对象的可辨识部分;利用第二学习网络的第一子网络提取第一关注区域的第一局部特征;以及至少部分基于第一局部特征确定图像中的对象的类别。通过该方案,实现了对于更精细尺度的图像区域的准确定位,从而可以获得基于精细尺度上的局部特征用于对象识别。
提供发明内容部分是为了简化的形式来介绍对概念的选择,其在下文的具体实施方式中将被进一步描述。发明内容部分无意标识要求保护的主题的关键特征或主要特征,也无意限制要求保护的主题的范围。
附图说明
图1示出了能够实施本公开的多个实现的计算设备的框图;
图2示出了根据本公开的一些实现的用于图像识别的系统的框图;
图3示出了根据本公开的另一些实现的用于图像识别的系统的框图;
图4示出了根据本公开的一个实现的用于图像识别的过程的示意图;以及
图5示出了根据本公开一些实现的用于图像识别的学习网络的训练过程的流程图。
这些附图中,相同或相似参考符号用于表示相同或相似元素。
具体实施方式
现在将参照若干示例实现来论述本公开。应当理解,论述了这些实现仅是为了使得本领域普通技术人员能够更好地理解且因此实现本公开,而不是暗示对本主题的范围的任何限制。
如本文所使用的,术语“包括”及其变体要被解读为意味着“包括但不限于”的开放式术语。术语“基于”要被解读为“至少部分地基于”。术语“一个实现”和“一种实现”要被解读为“至少一个实现”。术语“另一个实现”要被解读为“至少一个其他实现”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
图1示出了能够实施本公开的多个实现的计算设备100的框图。应当理解,图1所示出的计算设备100仅仅是示例性的,而不应当构成对本公开所描述的实现的功能和范围的任何限制。如图1所示,计算设备100包括通用计算设备形式的计算设备100。计算设备100的组件可以包括但不限于一个或多个处理器或处理单元110、存储器120、存储设备130、一个或多个通信单元140、一个或多个输入设备150以及一个或多个输出设备160。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710592777.5/2.html,转载请声明来源钻瓜专利网。