[发明专利]级联卷积神经网络有效
申请号: | 201780030005.0 | 申请日: | 2017-04-20 |
公开(公告)号: | CN109154988B | 公开(公告)日: | 2020-02-28 |
发明(设计)人: | L·沃夫;A·穆辛斯基 | 申请(专利权)人: | 台拉维夫大学拉莫特有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06N3/04;G06T1/40 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 张臻贤;李够生 |
地址: | 以色列,*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 级联 卷积 神经网络 | ||
一种用于检测至少一个图像中的至少一个对象的卷积神经网络系统。所述系统包括多个对象检测器,所述多个对象检测器对应于所述至少一个图像中的预定图像窗口大小。每个对象检测器与关于所述至少一个图像的相应的下采样比相关联。每个对象检测器包括相应的卷积神经网络和与所述卷积神经网络耦合的对象分类器。所述相应的卷积神经网络包括多个卷积层。所述对象分类器根据来自所述卷积神经网络的结果对所述图像中的对象进行分类。与相同相应的下采样比相关联的对象检测器定义至少一个对象检测器分组。对象检测器分组中的对象检测器与共用的卷积层相关联。
技术领域
所公开的技术大体来说涉及神经网络,并且具体来说涉及用于级联卷积神经网络的方法和系统。
背景技术
卷积神经网络(CNN)是本领域中已知的。这类网络通常用于图像中的对象检测和分类。卷积神经网络(CNN)通常由一个或多个层构造而成。在每个层处,进行运算。通常,这个运算是卷积运算和乘以激活函数中的一个。这个运算还可包括也称为下采样的汇集。
对于每个层,定义相应的设置元参数。这些元参数包括所使用的滤波器的数目、滤波器的大小、卷积下采样比的跨距、下采样大小的大小、下采样大小的跨距、所使用的激活函数等。现在参考图1,这个图是本领域中已知的CNN(大体标号为10)的示意图。CNN 10用于检测诸如图像16的图像中的特征。神经网络10包括多个层,诸如层121(图1)。CNN 10包括多个层121、122、……、12N和分类器14。输入图像16被供应到层121。层121至少将图像16与其相应的滤波器进行卷积并且将滤波器的输出中的每一个乘以激活函数。层121将其输出提供到层122,所述层122与相应的滤波器进行其相应的运算。这个过程重复,直到将层12N的输出提供到分类器14为止。层12N的输出是对应于CNN 10中所使用的滤波器的特征的图。这个特征图涉及特征在与特征图相关联的相应的图像窗口内存在于输入图像16中的概率。层12N的输出处的特征图可体现为各自对应于一个特征的多个矩阵,其中每个矩阵中的条目的值表示输入图像16在与矩阵中的条目位置(即,条目的索引)相关联的特定图像窗口(即,边界框)中包括与那个矩阵相关联的特征的概率。图像窗口的大小是根据CNN 10中的层数、核的大小和在卷积运算期间的核的跨距来确定的。
分类器14可为本领域中已知的任何类型的分类器(例如,随机森林分类器、支持向量机–SVM分类器、卷积分类器等)。分类器14对CNN 10被训练来检测的对象进行分类。分类器14可为每个图像窗口提供对象位于那个图像窗口中的相应的检测置信级以及分类信息。一般来说,分类器14的输出是与对应的图像窗口中的对象的检测和分类有关的值的一个或多个向量。这个或这些值的向量在本文中称为“分类向量”。
现在参考图2,这个图是本领域中已知的示例性CNN(大体标号为50)的示意图。CNN包括两个层:第一层511和第二层512。第一层511接收图像52作为到所述第一层511的输入。在第一层511中,进行卷积运算,而在第二层512中将激活函数应用于卷积的结果。图像52包括像素的矩阵,其中每个像素与相应的一个值(例如,灰度级值)或多个值(例如,颜色值)相关联。图像52可表示包括对象(例如,在街上行走的人、在公园玩耍的狗、街上的车辆等)的场景。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于台拉维夫大学拉莫特有限公司,未经台拉维夫大学拉莫特有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780030005.0/2.html,转载请声明来源钻瓜专利网。