[发明专利]用于确定输入语音的相关性的装置和方法有效
| 申请号: | 201210098990.8 | 申请日: | 2012-04-06 |
| 公开(公告)号: | CN102799262A | 公开(公告)日: | 2012-11-28 |
| 发明(设计)人: | O.卡林利 | 申请(专利权)人: | 索尼电脑娱乐公司 |
| 主分类号: | G06F3/01 | 分类号: | G06F3/01 |
| 代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 刘春元;王忠忠 |
| 地址: | 日本*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 确定 输入 语音 相关性 装置 方法 | ||
1.一种用于确定输入语音的相关性的方法,包括:
a) 识别时间间隔内的语音期间用户面部的存在;
b) 获得所述时间间隔期间与用户的面部相关联的一个或多个面部取向特性;以及
c) 基于在b)中获得的一个或多个取向特性来表征所述时间间隔期间的所述语音的相关性。
2.根据权利要求1所述的方法,其中,在b)中的获得所述一个或多个面部取向特性涉及使用照相机跟踪用户的面部取向特性。
3.根据权利要求2所述的方法,其中,在b)中的获得所述一个或多个面部取向特性还涉及使用红外光跟踪用户的面部取向特性。
4.根据权利要求1所述的方法,其中,在b)中的获得所述一个或多个面部取向特性涉及使用麦克风跟踪用户的面部取向特性。
5.根据权利要求1所述的方法,其中,在b)中的所述一个或多个面部取向特性包括头部倾角。
6.根据权利要求1所述的方法,其中,在b)中的所述一个或多个面部取向特性包括眼睛注视方向。
7.根据权利要求1所述的方法,其中,c)涉及在一个或多个所述面部取向特性落在允许的范围之外的情况下,将用户的语音表征为不相关。
8.根据权利要求1所述的方法,其中,c)涉及基于一个或多个所述面部取向特性从允许的范围的偏离来为用户语音的相关性加权。
9.根据权利要求1所述的方法,还包括在获得语音期间与用户的面部相关联的一个或多个面部取向特性之前寄存用户面部的轮廓。
10.根据权利要求1所述的方法,还包括确定语音源的方向,并且其中,c)包括在表征语音的相关性中取得语音源的方向。
11.根据权利要求1所述的方法,其中,c)包括在图像捕获设备捕获的图像内的多个语音源中进行辨别。
12.一种用于确定语音的相关性的装置,包括:
处理器;
存储器;以及
包含在所述存储器内的并且可由所述处理器执行的计算机编码指令,其中,所述计算机编码指令被配置成实施一种用于确定用户的语音的相关性的方法,所述方法包括:
a) 识别时间间隔内的语音期间用户面部的存在;
b) 获得所述时间间隔期间的语音期间与用户的面部相关联的一个或多个面部取向特性;
c) 基于在b)中获得的一个或多个取向特性来表征所述时间间隔期间的用户语音的相关性。
13.根据权利要求12所述的装置,还包括被配置成获得b)中的所述一个或多个取向特性的照相机。
14.根据权利要求12所述的装置,还包括被配置成获得b)中的所述一个或多个取向特性的一个或多个红外灯。
15.根据权利要求12所述的装置,还包括被配置成获得b)中的所述一个或多个取向特性的麦克风。
16.一种计算机程序产品,包括:
非暂态计算机可读存储介质,其具有包含在所述介质内的用于确定相关性语音的计算机可读程序代码,所述计算机程序具有:
a) 用于识别时间间隔内的语音期间用户面部的存在的计算机可读程序代码装置;
b) 用于获得所述时间间隔期间与用户的面部相关联的一个或多个面部取向特性的计算机可读程序代码装置;
c) 用于基于在b)中获得的一个或多个取向特性来表征用户的语音的相关性的计算机可读程序代码装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼电脑娱乐公司,未经索尼电脑娱乐公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210098990.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种改善聚合物太阳能电池光敏层相分离程度的方法
- 下一篇:开机计数系统及方法





