[发明专利]云终端解码器及其负载均衡算法和GPU的解码算法无效
申请号: | 201110391233.5 | 申请日: | 2011-11-30 |
公开(公告)号: | CN102404576A | 公开(公告)日: | 2012-04-04 |
发明(设计)人: | 曾华山;刘小瑞;马海峰;黄井优;李志宁;何剑荣;季统凯 | 申请(专利权)人: | 国云科技股份有限公司 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N7/50 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 523808 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 终端 解码器 及其 负载 均衡 算法 gpu 解码 | ||
技术领域
本发明涉及视频数据处理技术领域,尤其是一种MPEG2的云终端解码器及其负载均衡算法和GPU的解码算法。
背景技术
目前,云终端播放视频时,采用传统MEPG2的解码,虚拟桌面操作会出现卡屏、抖屏等现象。制约着用户体验的顺畅性。
传统基于单处理器的MPEG2解码器架构如图1所示;数据经过变长编码(Variable Length Decode,VDL)之后分成两部分,一部分是MV信息,另一部分是图像块的残差信息。MV信息被用来进行运动补偿,和来自帧缓存的延迟的重建帧一起作为运动补偿(Motion Compensation,MC)的输入数据,以生成当前帧的预测帧;而残差数据经过反量化(Inerse Quantization,IQ)和反余弦变换(Inverse DCT,IDCT)之后生成残差帧,和预测帧相加生成当前的重建帧。在不至于引起混淆的情况下,预测帧相加的重建操作也常常被并入MC中。
如图1所示,在解码器中存在一个从重建帧到MC的反馈回路,如果将这个反馈回路切开,将其组成部分放在不同的处理器上处理,则必然在GPU和CPU之间既出现上行的数据传输,又出现下行的数据传输,CPU和GPU之间的频繁交互会导致CPU和GPU的工作的过多切换,造成额外的损耗。
传统的解码器都是基于MB Level的,依照顺序对每一个宏块完成IQ、IDCT、MC,在一些DSP或者ASIC上实现的解码器,同样也是在MB Level上利用多处理器核心进行并行优化。
发明内容
本发明解决的技术问题之一在于提供一种MPEG2云终端解码器,可有效克服终端CPU占用率高、资源达到瓶颈,从而导致播放视频不流畅的问题。
本发明解决的技术问题之二在于提供一种云终端解码器的负载均衡算法,可根据GPU的工作状态调整其处理的内容。
本发明解决的的技术问题之三在于提供一种云终端解码器的GPU的解码算法。
本发明解决前述技术问题之一的技术方案是:在对视频编码压缩时,由CPU和GPU共同进行,即将编码的运动估计由GPU完成;并将重建帧到运动估计的反馈通路切断,用原始帧取代重建帧进行运动估计,消除CPU和GPU的互相依赖。
所述的解码器其MC和IDCT由GPU完成。
所述的解码器其MC、IDCT和IQ由GPU完成。
本发明解决前述技术问题之二的技术方案是:如果GPU在一段时间内一直都处于忙的状态,则将解码器架构级别降低一级,反之则增加一级,即在Level1-3之间进行切换;其中Level代表解码器的架构级别,Level=1表示仅由GPU完成MC,Level=2表示由GPU完成MC和IDCT,Level=3表示MC、IDCT、和IQ都由GPU完成。
定义参数Ft决定每隔多少帧进行一次GPU的工作状态的检查,而参量Th决定在连续多少次GPU工作状态相同后可以进行级别的切换;即Ft和Th决定均衡算法的敏感度,一般这两个参量设为20和3。
本发明解决前述技术问题之三的技术方案是:首先给每类宏块都规定一个类型值,在深度测试中如果当前宏块的深度值等于ZBuffer中的类型值,就通过测试以执行这个宏块的MC;这样每次渲染都完成一类宏块的MC。
流程可以分为两大步骤:(1)、根据宏块类型,更新ZBuffer;2、以ZBuffer为掩模块,执行n-Pass的渲染操作,每pass完成一类宏块的运动补偿,n是宏块类型数目。
本发明采用给云终端配置一款显卡,针对CPU+GPU的并行架构的云编码器,提出了基于Frame Level的CPU+GPU的并行架构的云解码器,它工作在CPU+GPU的硬件体系下,在该解码器中,码流读取和熵解码工作将始终由CPU完成,而MC的工作始终由GPU完成,把MC转移到GPU上,避免帧缓存从显存中download到主内存中,从而避免耗时过多。采用基于深度测试的ZBC算法,并充分利用了GPU的并行计算技术,从而,有效的降低了CPU的占用率,解决了云终端播放视频时的资源瓶颈问题。并且GPU的视频解码效率比CPU效率要高很多,保证了云终端视频播放的流畅度。
服务器通过CPU+GPU进行视频数据的编码压缩工作,可实现多台云终端同时播放视频,同时,在客户端同样采用CPU+GPU解码,实现每台云终端的视频播放的流畅度。
本发明就是把包括运动补偿、相加和帧缓冲的整个反馈回路都放在GPU上去执行,以使视频解码效果更优。采用3种级别来实现并行解码器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国云科技股份有限公司,未经国云科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110391233.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:牵拉裁切装置
- 下一篇:显示处理画面撷取系统及其方法