[发明专利]对象检测装置及其学习装置无效
| 申请号: | 200680021640.4 | 申请日: | 2006-06-14 |
| 公开(公告)号: | CN101198987A | 公开(公告)日: | 2008-06-11 |
| 发明(设计)人: | 藁谷克则;河合富美;王子敬 | 申请(专利权)人: | 松下电器产业株式会社 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/00 |
| 代理公司: | 中原信达知识产权代理有限责任公司 | 代理人: | 陆锦华;黄启行 |
| 地址: | 日本*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 对象 检测 装置 及其 学习 | ||
技术领域
本发明涉及一种用于从图像中检测诸如人脸的对象的对象检测装置,以及一种用于该对象检测装置的学习装置。
背景技术
在计算机视觉中,对象检测技术被断定是应用于决定对象在图像中是否捕捉到特定对象的学科。作为对象,有汽车、行人、人脸等。在许多应用中,对象检测被认为是非常难的问题。例如,在对象是人脸的情况下,脸部看来如何很大程度上取决于人脸的方向、照明以及由太阳镜、面具等造成的部分遮挡而发生变化。此外,当画面质量失常以及在图像上叠加了噪声或者当在图像中所得到的脸部较小时,在监控系统等所使用的应用中检测人脸更加困难。
作为用于解决对象检测中问题的常见系统,有基于统计学习的模式识别技术。根据预先给出的学习样本来决定识别器的参数。作为在人脸检测中的常见方法,有使用神经网络、支持向量机、Bayes估计等方法。通常,基于特征选择技术以从输入图像中提取在识别中使用的特征量、基于识别器构建技术以构建用于根据所选择的特征量的输入决定对象是否存在的识别器、以及基于通过使用所构建的识别器来决定在图像窗口中是否存在人脸的技术,来构造这些方法。在此,“图像窗口”指的是在输入图像中的部分区域。可以从输入图像上切割出其中部分区域的位置或尺寸被改变的大量窗口。
作为识别器构建方法,有非专利文献1中已知的自适应提升(Adaptive Boosting)或Adaboost方法。在下文中,该方法被称作“Adaboost学习方法”。该方法适用于许多对象检测装置,并且在非专利文献2中陈述了使用该方法从图像中检测人脸的方法。在Adaboost学习方法中,识别器可以具有较高的误差率从而识别误差可以被设置为50%或更低,并且该识别器被称作弱分类器。在Adaboost学习方法中,通过在大量准备好的弱分类器中选择一些弱分类器并且随后组合这些弱分类器来构建误差率较低的强分类器。
作为通过使用Adaboost学习方法来实时检测正面人脸的方法,有在非专利文献2和专利文献1中陈述的方法。在人脸识别器也就是在非专利文献2和专利文献1中陈述的人脸传感器中,采用了其中串联多个强分类器的级联结构。在该级联结构中,所连接的分类器被称为级以及位于最靠近输入侧的第一级被称为第一级强分类器或在第一级处的级识别器。通过根据Adaboost学习方法执行学习并随后根据从为了学习目的的输入图像中提取的特征量连接大量的弱分类器,来构建在每一级处的识别器。针对人脸图像的学习样本来训练每一级的识别器,从而使得这些学习样本可以几乎被100%正确地识别,但是针对非人脸图像的学习样本来训练,从而使得非人脸图像的学习样本可以几乎被50%正确地识别。在第一级的级识别器决定输入图像是否对应于人脸,以及在第一级以及后面的级处的级识别器分别决定由在第一级的级识别器所决定的作为人脸的输入图像是否对应于人脸。由于由在第n级的级识别器决定为非人脸的输入图像不再被处理,并且做出该输入图像不是人脸的决定,所以可以有效地进行处理。因此,已知上述方法可以以大约每秒15帧的处理速度操作。
此外,还有通过使用不同的学习样本并且综合这些识别结果来构建多个人脸传感器从而改善识别准确度的方法。作为该方法的实例,在非专利文献2中示出了多数票决系统。非专利文献2的作者Viola等人指出制备三个级联识别器(具有级联结构的识别器)以及通过对这些输出结果的多数票决来降低识别误差。在非专利文献3示出的另一应用中,非专利文献3的作者Rowley等人训练许多神经网络以构建人脸传感器。作为连接多个传感器的结果的方法,已经提出了使用被训练的神经网络以从提出代替多数票决系统的大量神经网络传感器来输出最终结果的方法。
作为提取特征量来检测人脸的方法,在非专利文献2中Viola等人已经提出了被称作矩形特征的特征。通过分别测量由矩形滤波器所限定的矩形部分区域之间的亮度差,来提取图像窗口的矩形特征。
此外,作为另一个特征量提取方法,已经在非专利文献4中提出了“Modified Census Transform”。通过将输入图像中的3×3像素块转换为二值图像来提取特征量。将块中像素的亮度值与块中亮度平均值进行比较。如果像素的亮度值高于平均值,那么标记值1,反之如果像素的亮度值不高于平均值,那么标记值0。由此,通过顺序地排列块中所有像素的标记,来获得9-比特的信息,并且该信息被用作特征量的值。
专利文献1:美国专利申请公开2002/0102024说明书
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680021640.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:改进的双层枕式膜结构
- 下一篇:核苷酸类似物前体药物及其制剂





