[发明专利]信息处理设备、信息处理方法和程序无效
| 申请号: | 201110137946.9 | 申请日: | 2011-05-26 |
| 公开(公告)号: | CN102279977A | 公开(公告)日: | 2011-12-14 |
| 发明(设计)人: | 青山一美;佐部浩太郎 | 申请(专利权)人: | 索尼公司 |
| 主分类号: | G06T7/20 | 分类号: | G06T7/20;G06K9/62 |
| 代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 曲瑞 |
| 地址: | 日本*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 信息处理 设备 方法 程序 | ||
1.一种信息处理设备,包括:
第一产生装置,其用于根据学习运动图像的各帧产生分别对应于所述学习运动图像的各帧的学习图像,在所述学习运动图像中对进行预定运动的被摄体进行成像;
第一合成装置,其用于通过将顺序产生的学习图像中的一个设置成用作基准,以及将包括用作所述基准的所述学习图像的对应于预定帧数的多个学习图像按预定位置布置并且进行合成,来产生合成学习图像;
学习装置,其用于计算所产生的所述合成学习图像的特征量,并且通过使用作为计算结果得到的所述特征量执行统计学习以产生辨别器,所述辨别器辨别用作输入的合成判定图像的基准的判定图像是否对应于所述预定运动;
第二产生装置,其用于根据判定运动图像的各帧产生分别对应于所述判定运动图像的各帧的判定图像,所述判定运动图像为是否对应于所述预定运动的判定对象;
第二合成装置,其用于通过将顺序产生的所述判定图像中的一个设置成用作基准,以及将包括用作所述基准的所述判定图像的对应于预定帧数的多个判定图像按预定位置布置并且进行合成,来产生合成判定图像;
特征量计算装置,其用于计算所产生的所述合成判定图像的特征量;以及
判定装置,其用于基于作为通过将计算出的所述特征量输入到所述辨别器得到的辨别结果的评分,判定用作所述合成判定图像的基准的所述判定图像是否对应于所述预定运动。
2.根据权利要求1所述的信息处理设备,其中图像的特征量是像素差特征量。
3.根据权利要求2所述的信息处理设备,还包括:
归一化装置,其用于归一化作为通过将计算出的所述特征量输入到所述辨别器得到的辨别结果的评分,
其中所述判定装置基于归一化的评分判定用作所述合成判定图像的基准的所述判定图像是否对应于所述预定运动。
4.根据权利要求2所述的信息处理设备,
其中所述预定运动是作为被摄体的人的语音,以及
其中所述判定装置基于作为通过将计算出的所述特征量输入到所述辨别器得到的辨别结果的评分,判定用作所述合成判定图像的基准的所述判定图像是否对应于语音段。
5.根据权利要求4所述的信息处理设备,
其中所述第一产生装置从说话的人被作为被摄体成像的所述学习运动图像的各帧中检测人的面部区域,从检测到的所述面部区域中检测唇部区域,并且基于检测到的所述唇部区域产生唇部图像作为所述学习图像,以及
其中所述第二产生装置从所述判定运动图像的各帧中检测人的面部区域,从检测到的所述面部区域中检测唇部区域,并且基于检测到的所述唇部区域产生唇部图像作为所述判定图像。
6.根据权利要求5所述的信息处理设备,其中当从所述判定运动图像中待处理的帧中没有检测到所述面部图像时,所述第二产生装置基于之前帧中检测到的面部图像的位置信息产生所述唇部图像作为所述判定图像。
7.根据权利要求2所述的信息处理设备,
其中所述预定运动是作为被摄体的人的语音,以及
其中所述判定装置基于作为通过将计算出的所述特征量输入到所述辨别器得到的辨别结果的评分,判定对应于用作所述合成判定图像的基准的所述判定图像的语音内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110137946.9/1.html,转载请声明来源钻瓜专利网。





