[发明专利]一种面向8K的AVS2超高清视频编码码率控制方法有效
| 申请号: | 201910944715.5 | 申请日: | 2019-09-30 |
| 公开(公告)号: | CN110662045B | 公开(公告)日: | 2021-10-15 |
| 发明(设计)人: | 廖义;李日;谢亚光 | 申请(专利权)人: | 杭州当虹科技股份有限公司 |
| 主分类号: | H04N19/152 | 分类号: | H04N19/152;H04N19/149;H04N19/124;H04N19/177 |
| 代理公司: | 杭州橙知果专利代理事务所(特殊普通合伙) 33261 | 代理人: | 林伟 |
| 地址: | 310012 浙江省杭州市西*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 avs2 超高 视频 编码 控制 方法 | ||
本发明公开了一种面向8K的AVS2超高清视频编码的码率控制方法。它具体包括如下步骤:(1)在帧层码率控制中,当编码第i帧前,根据视频目标码率C、第i帧在miniGOP中的权重和第i帧的SATD值D(i)求取量化步长q(i),并计算之后N帧的SATD值;(2)利用RQ模型计算出第i到i+N帧的预估比特数;(3)定义第i帧的缓冲区预测值F(i),判断F(i)是否小于0.5或者大于0.8,来确定最优量化步长;(4)开始编码第i帧中的第j个CU,判断第j个CU是否是当前帧中的最后一个CU,若是则更新缓冲区并执行步骤(1),若否则执行步骤(4)。本发明的有益效果是:能够使缓冲区得到及时更新,能够有效控制缓冲区,减少码率溢出,提升编码质量的稳定性。
技术领域
本发明涉及视频编码相关技术领域,尤其是指一种面向8K的AVS2超高清视频编码的码率控制方法。
背景技术
AVS2是我国第二代数字视频编码标准,它规定了适应多种比特率、分辨率和质量要求的高效视频压缩方法的解码过程,在相同的压缩效率下,其编码速度可以达到开源平台x265的8倍以上,非常适合于4K/8K超高清电视实时直播的应用。4K/8K视频的数据量大,对网络带宽的要求高,此外,4K/8K 的实时直播通常要求编码器的速度达到50帧/秒以上,如何在一定的网络带宽和速度要求下提升视频输出质量是视频编码技术发展的一个关键。
视频图像数据有极强的相关性,一帧图像内部有很多邻近像素的数据是相似或相同的,这就是空域冗余,而视频中邻近帧之间的数据也存在很多相似或重复,这就是时域冗余,编码压缩就是将数据中的这些冗余信息去掉,帧内编码技术可以去除空域冗余,而帧间编码技术则可以去除时域冗余。为了提升编码压缩效率,编码器将各输入帧分为I帧、B帧、P帧,其中I帧采用帧内编码方式,编码失真小但是消耗比特数多,P帧采用前向预测的帧间编码方式,所消耗的比特数略少,而B帧采用双向预测的帧间编码方式,所消耗的比特数最少。图1是AVS2中常用的分级B帧结构,它将1个P帧和 7个B帧组成1个miniGOP,并将7个B帧分为3个等级:B1级、B2级、 B3级。
码率(单位时间内的比特数)控制是视频编码的一个重要环节,它通过获取视频信源特性(如运动剧烈程度、图像纹理复杂度等)和可用网络带宽来计算视频中每一帧图像和该图像中的各个CU(Coding Unit,编码单元)应该分配的比特数,指导编码器对视频进行编码,使输出的码流符合信道的传输,同时使输出的视频质量尽可能好。由于视频信源每帧的复杂度(比特数)不相同,而网络带宽则是恒定的,因此码率控制中需要设置缓冲区,使编码出的码流以恒定的码率(单位时间内的比特数)发送到网络中。
AVS2码率控制算法基本可以分为三层:miniGOP层码率控制、帧层码率控制和CU(Coding Unit,编码单元)层码率控制。miniGOP层码率控制目的就是根据视频特性、视频目标码率、缓冲区饱和度计算各个miniGOP的目标码率;帧层码率控制将一个miniGOP的目标码率划分到miniGOP中的各个帧,根据各帧的复杂度、各帧的权重因子、缓冲区饱和度计算各帧的目标码率; CU层码率控制在帧级QP的基础上根据CU纹理复杂度计算量化参数供CU进行编码。在CU编码过程中,各个CU需要通过RDO(Rate distortion optimization,率失真优化)来获取最优编码模式,从而在比特数一定的条件下获得最小失真。在RDO结束后,需要进行熵编码输出码流同时获取CU所消耗的实际码率,该实际码率可以更新到缓冲区,方便后续帧的帧级码率控制。
视频信源中每帧的复杂度不相同,一旦发生场景切换则复杂度变化非常大,容易导致输出的码流不再以恒定的码率发送至网络,出现缓冲区溢出(缓冲区饱和度超过缓冲区最大值或者小于0),这对于码率控制算法的要求非常高。原始AVS2方法未能提前分析未来若干帧对缓冲区的占用情况,当视频内容由简单场景切换为复杂场景时,码率会突然增大造成缓冲区下溢,使输出断流。此外,原始方法为了提升编码速度,将RDO和熵编码置于两个不同的线程,熵编码进度远远滞后于RDO导致各CU熵编码计算出的比特数无法实时更新到缓冲区,进一步造成码率控制不准。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州当虹科技股份有限公司,未经杭州当虹科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910944715.5/2.html,转载请声明来源钻瓜专利网。





