[发明专利]信息处理设备和方法、程序以及记录介质无效
| 申请号: | 200910179416.3 | 申请日: | 2009-10-09 |
| 公开(公告)号: | CN101714212A | 公开(公告)日: | 2010-05-26 |
| 发明(设计)人: | 佐部浩太郎 | 申请(专利权)人: | 索尼株式会社 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
| 代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 宋鹤;南霆 |
| 地址: | 日本*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 信息处理 设备 方法 程序 以及 记录 介质 | ||
技术领域
本发明涉及信息处理设备和方法、程序以及记录介质,并且更具体而言,涉及使得能够根据图像的场景对图像进行分类的信息处理设备和方法、程序以及记录介质。
背景技术
近年来,数字相机等已被广泛使用,并且用户拥有更多机会来处理图像。例如,利用数字相机等捕获的图像数目增加。因此,用户希望根据某些条件对所捕获的图像进行分类和管理。大多数捕获图像是包括人的脸部的图像。考虑这些东西,例如,已经提出了根据图像是否是肖像图片来对图像进行分类,并且当图像是肖像图片时,对图像中的脸部进行判别和分类。为了实现以上所述,有必要对人的脸部和脸部的方向进行判别(例如,见日本未审查专利申请特开2005-284487和2005-157679)。
发明内容
已经针对对所捕获的图像的场景进行进一步判别进行了研究。在这些研究中,许多高度熟练的技术使用在图像中出现的局部特征样式的外观的频率,例如颜色或边缘。对外观的频率进行向量化,并且采用向量化的特征空间。在该特征空间中,基于执行哪种判别,统计地学习具有给定场景的标签的关系来获得标识器。
利用这样的技术,可以粗略地判别与整个外观明显不同的场景,例如风景、都市、人和食物。然而,很难在理解场景的含义之后判别场景,例如某一图像与旅行场景和集体合影场景相对应。
某些统计数据显示70%的捕获图像是肖像图片。因此,当用户为了图像搜索的目的希望对图像进行分类时,仅根据它们是否是消息图片来对图像进行简单分类是不够的。为了完全地满足该目的,有必要根据某些条件来对肖像图片进行进一步的分类。
本发明提供了用于在理解图像场景的情况下判别图像的场景的技术。
根据本发明实施例,提供了一种信息处理设备,包括以下元件:用于在图像中检测脸部的脸部检测装置;用于判别由所述脸部检测装置检测出的脸部的属性的判别装置;用于从由所述脸部检测装置检测出的脸部和由所述判别装置判别出的属性中生成所述图像的特征量的生成装置;以及用于从由所述生成装置生成的特征量中学习用于判别所述图像是否与预定场景相对应的信息的学习装置。
该脸部检测装置可以检测至少图像中的脸部的位置、大小和方向以及图像中的脸部的数目,并且该生成装置通过将脸部的位置和大小转换成独立于图像的大小的值来生成特征量。
所述属性可以是以下内容中的至少一个:面部表情、性别、年龄、种族、眼睛是否闭着、是否佩戴眼镜、眼睛是否朝着相机以及光照是否均匀。
所述生成装置可以生成所述特征量作为总共M×N维的向量,该向量对于所述图像中所包括的M个脸部的每个脸部具有N维信息。
所述学习装置可以通过执行助推来执行学习。
可以基于通过所述学习装置所执行的学习而获得的信息来判别用作处理目标的图像的场景。
根据本发明另一实施例,提供了一种信息处理方法,包括以下步骤:在图像中检测脸部;判别所检测出的脸部的属性;从所检测出的脸部和所判别出的属性中生成所述图像的特征量;以及从所生成的特征量中学习用于判别所述图像是否与预定场景相对应的信息。
根据本发明另一实施例,提供一种用于执行处理的计算机可读程序,该处理包括以下步骤:在图像中检测脸部;判别所检测出的脸部的属性;
从所检测出的脸部和所判别出的属性中生成所述图像的特征量;以及
从所生成的特征量中学习用于判别所述图像是否与预定场景相对应的信息。
根据本发明另一实施例,提供了一种记录介质,其上记录了以上所述的程序。
在根据本发明实施例的信息处理设备和方法以及程序中,脸部在图像中被检测出;脸部的属性被判别;图像的特征量被从所检测到的脸部和所判别出的属性中生成;并且用于判别图像是否与预定场景相对应的信息被学习。
根据本发明实施例,可以在理解图像的场景的情况下,判别图像的场景。
附图说明
图1是图示出根据本发明一个实施例的学习装置的结构的示图;
图2是描述学习的流程图;
图3是描述脸部检测的示图;
图4包括作为脸部检测的结果而获得的信息的示图;
图5是描述局部检测的示图;
图6包括描述作为局部检测的结果而获得的信息的示图;
图7包括描述属性的示图;
图8是描述特征量的示图;
图9是描述与学习相关的处理的流程图;
图10A至图10F是描述场景的示图;
图11是图示出根据本发明的一个实施例的分类装置的结构的示图;
图12是描述分类处理的流程图;以及
图13是描述记录介质的示图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼株式会社,未经索尼株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910179416.3/2.html,转载请声明来源钻瓜专利网。





