[发明专利]基于人眼感知模型的码率控制方法无效
申请号: | 200910049042.3 | 申请日: | 2009-04-09 |
公开(公告)号: | CN101534432A | 公开(公告)日: | 2009-09-16 |
发明(设计)人: | 郭凤;潘琤雯;滕国伟;郁志明;石旭利 | 申请(专利权)人: | 上海广电(集团)有限公司中央研究院 |
主分类号: | H04N7/24 | 分类号: | H04N7/24;H04N7/26;H04N7/50 |
代理公司: | 上海思微知识产权代理事务所 | 代理人: | 屈 蘅;李时云 |
地址: | 200233*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 感知 模型 控制 方法 | ||
技术领域
本发明涉及数字视频编码技术,特别是涉及一种基于人眼感知模型的码率控制方法。
背景技术
码率控制是视频编码的关键技术之一,是编码器基于对网络可用带宽的估计决定要发送到信道上的视频比特流速率的过程。控制的关键在于在码率大小和视频压缩质量间找到一个平衡。因此码率控制算法的好坏直接影响了编码器的性能和效率。在现有的几个压缩标准中,如H.264/AVC和AVS,其码率控制方法仅根据视频内容的复杂程度进行码率分配,即,给纹理复杂的部分分配更多的比特数。但是,视频的最终接收者是人类,人对于视频的关注情况会由人脑对视频的感知特性和对视频内容的理解来决定。在许多科学工作者的努力下,我们已经发觉人眼对于视频中的运动物体以及物体的边缘轮廓会投入更多的关注度。因此,如果想更加有效的为不同帧、不同宏块分配目标比特数,就必须把人眼视觉特征考虑到码率控制中去。
发明内容
本发明的目的在于提供一种基于人眼感知模型的码率控制方法,所述方法根据视频图像的动态特征和静态特征,建立人类视觉的静态注意力模型和动态注意力模型,并通过这两种模型提取出视频图像中的人眼重点关注的区域,以区分非重点关注的区域,实现针对图像中重要程度不同的区域进行分类量化编码,进而实现基于人眼感知的码率控制方法。
本发明的目的是这样实现的:一种基于人眼感知模型的码率控制方法,所述码率控制方法分别进行帧级和宏块级码率控制,以确定比特数的分配,其中,宏块的大小为h*h,h为自然数,所述的码率控制方法通过以下步骤实现:
步骤1、提取视频图像的静态特征,并建立静态特征模型;
步骤2、提取视频图像的动态特征,并建立动态特征模型;
步骤3、取静态特征模型和动态特征模型的交集,得到该视频的运动图像部分及其轮廓,即动静态综合特征模型;
步骤4、在帧级码率控制算法中,利用提取的动态特征模型,计算出每一帧中运动对象块所占全部宏块数的比率,并用该比率修正当前编码帧中各宏块和编码对应参考帧中对应宏块像素点的平均绝对差MAD的原线性预测模型MAD(n)=k1*MAD(n-1)+k2,在预分配比特数时,根据运动对象块的多少,来反映当前帧的运动复杂度,从而决定分配比特数的多少来实现码率控制,其中k1为该模型的线性比例系数,k2为该模型的常系数,n为图像帧序号;
步骤5、在宏块级码率控制中,首先根据动静态综合特征模型,计算出动静态综合特征模型内的像素所占宏块内总像素的比率,并通过该比率获得一个调节参数,在码率控制中用调节参数修改原有的目标比特数平均分配公式Bit(n,I,J)=frb(n,I,J)/Nub,实现人眼感知下的最佳码率控制效果,其中,n为图像帧序号,(I,J)表示宏块的坐标,Bit(n,I,J)为目标比特数,frb(n,I,J)为待分配的总的比特数,Nub是待分配的宏块数量。
所述步骤1中的静态特征的提取和静态特征模型的建立进一步通过以下步骤实现:
步骤1.1、将当前视频的每个像素点从YUV格式转换成RGB格式;提取红R、绿G、蓝B和黄色Y四基色,并获得四基色的色度特征图分别为R(r,g,b)、G(r,g,b)、B(r,g,b)和Y(r,g,b);提取红/绿、蓝/黄两组对抗色,并获得红/绿特征图RG(i,j)=|(R(i,j)-G(i,j))|以及蓝/黄特征图BY(i,j)=|(B(i,j)-Y(i,j))|,其中(i,j)表示像素点的坐标;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海广电(集团)有限公司中央研究院,未经上海广电(集团)有限公司中央研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910049042.3/2.html,转载请声明来源钻瓜专利网。