[发明专利]用于提供个人视频服务的系统和方法有效
| 申请号: | 200880006422.2 | 申请日: | 2008-01-04 |
| 公开(公告)号: | CN101622876A | 公开(公告)日: | 2010-01-06 |
| 发明(设计)人: | C·P·佩斯 | 申请(专利权)人: | 欧几里得发现有限责任公司 |
| 主分类号: | H04N7/24 | 分类号: | H04N7/24 |
| 代理公司: | 北京市金杜律师事务所 | 代理人: | 王茂华 |
| 地址: | 美国马*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 提供 个人 视频 服务 系统 方法 | ||
相关申请
本申请要求对2007年1月23日提交的美国临时申请No. 60/881,979的优先权。本申请与2007年1月23日提交、标题为 “Computer Method and Apparatus for Processing Image Data”的美国临 时申请No.60/881,966和于2006年6月8日提交、标题为“Apparatus And Method For Processing Video Data”的美国临时申请 No.60/811,890号有关。本申请与2006年3月31日提交的美国申请 No.11/396,010有关,该美国申请No.11/396,010是于2006年1月20 日提交的美国申请No.11/336,366的部分继续申请,该美国申请 No.11/336,366是于2005年11月16日提交的美国申请No.11/280,625 的部分继续申请,该美国申请No.11/280,625是于2005年9月20日 提交的美国申请No.11/230,686的部分继续申请,该美国申请 No.11/230,686是现为美国专利No.7,158,680、于2005年7月28日 提交的美国申请No.11/191,562的部分继续申请。通过整体引用将各 前述申请结合于此。
背景技术
随着数字视频近来迅速普及,对视频压缩的需求已经急剧增 加。视频压缩减少了存储和传输数字媒体所需的比特数。视频数据 包含空间冗余性和时间冗余性,并且可以通过登记(register)帧内 (空间)和帧间(时间)的差值来对这些空间和时间相似性进行编 码。执行压缩的硬件或软件称为编码解码器(编码器/解码器)。编 码解码器是能够对数字信号进行编码和解码的设备或软件。由于数 据密集的数字视频应用已经变得无处不在,所以需要更高效的信号 编码方式。因此,视频压缩现在已经成为存储和通信技术中的一个 中心组成。
编码解码器常常使用于许多不同技术如视频会议、视频博客和 其它流媒体应用(例如视频播客(podcast))中。通常,视频会议 或视频博客系统实时提供对音频和视频流的数字压缩。视频会议和 视频博客的问题之一在于许多参与者受困于外观感受。然而,在纯 音频通信中,呈现可接受的屏上(on-screen)外观这一负担并不是 一个问题。
视频会议和视频博客带来的另一问题在于信息压缩可能造成 视频质量下降。压缩率是视频会议中的最重要因素之一,因为压缩 率越高,视频会议信息传输越快。遗憾的是,利用常规视频压缩方 案,压缩率越高,视频质量越低。压缩视频流常常造成不良的图像 和不良的声音质量。
一般而言,常规视频压缩方案受困于形式上表现为低数据通信 速度、大量储存要求和干扰感知效果的诸多低效性。这些阻碍可能 给需要容易、高效地操控视频数据而不牺牲质量(对于人们所具有 的对某些形式的视觉信息的先天敏感性而言,这尤为重要)的各种 用户带来严重问题。
在视频压缩中通常要考虑的诸多关键因素包括:视频质量和比 特率、编码和解码算法的计算复杂度、对数据损失和错误的抗扰性 以及延时。随着数量越来越多的视频数据充斥因特网,可以明显缓 解拥塞或提高质量的技术不仅对于计算机而且对于电视机、蜂窝电 话和其它手持设备而言都代表一种重大突破。
发明内容
提供用于处理视频的系统和方法,以取得相对于本领域现有技 术方法而言的计算上和分析上的优点。提供视频压缩技术,以减少 在视频会议或视频博客应用中存储和传输数字媒体所需的比特数。 创建视频会议参与者的照片真实感头像表示。该头像表示可以基于 视频流中描绘会议参与者的部分。基于对象的视频压缩算法可以使 用脸部检测器(如Violla-Jones脸部检测器)对会议参与者的脸部进 行检测、跟踪和分类。基于所检测的脸部,并结合普通脸部的预定 对象模型的配准,创建用于结构、形变、外观和照明的对象模型。 这些对象模型用来创建视频会议参与者的隐式表示,并由此生成视 频会议参与者的照片真实感头像表示。
这一描绘可以是视频会议参与者脸部的逼真版本。其在用户的 外貌和表情方面可以是准确的。原始捕获帧的其它部分可以通过较 低的精度来描绘。可以对每个唯一的用户执行一次短校准会话。这 将使系统能够初始化压缩算法并且创建对象模型。优选地,后续视 频会议会话将无需附加校准。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于欧几里得发现有限责任公司,未经欧几里得发现有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880006422.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:无线节点搜索程序
- 下一篇:由服务器播送音频和视频数据序列的方法





