[发明专利]分层结构预判的快速视频编码方法有效

申请号：	201110098369.7	申请日：	2011-04-20
公开（公告）号：	CN102186070A	公开（公告）日：	2011-09-14
发明（设计）人：	刘鹏宇;贾克斌	申请（专利权）人：	北京工业大学
主分类号：	H04N7/26	分类号：	H04N7/26;H04N7/34
代理公司：	北京思海天达知识产权代理有限公司 11203	代理人：	魏聿珠
地址：	100124 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种分层结构预判的快速视频编码方法，涉及视频压缩编码领域。其从原始视频数据中提取当前编码宏块的亮度信息；定义、计算并比较当前编码宏块的时/空相关性特征，率先预判出宏块应采用帧间预测或帧内预测；若选择帧间预测，定义、计算宏块的平坦度特征，并根据该特征将当前编码宏块分为平坦宏块、纹理丰富宏块和特征不显著宏块三个类型，有针对性的预判出应采用的帧间预测模式集合，提前确定最优帧间预测模式，实现快速帧间压缩编码。本发明方法在视频质量无损失，压缩码率不增加，保持输出码流结构的前提下，大幅度降低帧间编码复杂度和编码时间，继承了原标准算法高压缩比的优越性能。
搜索关键词：	分层结构快速视频编码方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.分层结构预判的快速视频编码方法，是根据对当前编码宏块特征提前筛选出最优帧间预测编码模式，采用分层预判，首先根据宏块时/空相关性提前判断宏块应该采用帧间预测或帧内预测；若选择帧间预测，再根据宏块的平坦度特征有针对性的选择出现概率较大的帧间预测模式集合，舍弃出现概率较小的帧间预测模式集合，从而取代H.264/AVC原标准帧间预测算法中穷举式的遍历搜索方法，提前确定最优帧间预测模式，实现快速帧间压缩编码；其特征在于包括下述步骤：步骤一：从视频帧中提取当前编码宏块的亮度分量值；步骤二：利用宏块空间、时间相关性提前筛选宏块预测模式，用原始信号与重建信号间的平方差值和SSD(s，c|QP)代表宏块相关性：SSD(s,c|QP)=Σm=1,n-116.16(sY[x+m,y+n|QP]-cY[x+m,y+n|QP])2---(1)]]>式中，16为宏块的水平像素数和垂直像素数，QP是编码量化步长，s为原始视频亮度信号，c为采用预测模式编码后的重建视频亮度信号，s_Y[x，y|QP]，c_Y[x，y|QP]分别表示量化步长为QP时，原始和重建视频亮度信号的取值，x，y是宏块在视频帧中的位置，具体包括以下步骤：1)SSD_int ra代表宏块空间相关性，SSD_int er代表宏块时间相关性；SSD_int ra的计算公式为：SSDintra=Σm=1,n=116,16(sY[x+m,y+n]-cY[x+m-1,y+n])2+Σm=1,n=116,16(sY[x+m,y+n]-cY[x+m,y+n-1])2---(2)]]>式中，SSD_int ra是用编码宏块的周围相邻像素作为预测像素，经过垂直和水平方向预测的平方差值和，s_Y[x+m，y+n]是视频帧中当前编码宏块的像素亮度值，c_Y[x+m-1，y+n]，c_Y[x+m，y+n-1]是与当前编码宏块在垂直和水平方向相邻宏块的像素亮度值，x，y是宏块在视频帧中的位置，m，n代表宏块中像素的位置；SSD_int er的计算公式为：SSDinter=Σm=1,n=116,16(sY[x+m,y+n]-cY[x+m,y+n])2---(3)]]>式中，SSD_int er为编码宏块与前帧宏块的预测平方差值和，s_Y[x+m，y+n]表示当前编码宏块的像素亮度值，c_Y[x+m，y+n]表示前帧中对应位置宏块的像素亮度值，x，y代表宏块在视频帧中的位置，m，n代表宏块中像素的位置；2)比较SSD_int ra和SSD_int er的大小，筛选当前编码宏块应采用的预测模式类型，引入调整因子α和β；判别公式为：Th₁＝α·SSD_intra-SSD_interTh₂＝SSD_int ra-β·SSD_inter (4)上式中，α，β均为取值在[0，1]间的实数，若Th₁大于零，说明帧内预测模式的平方差值和大于帧间预测模式的平方差值和，证明宏块的帧间相关性大于帧内相关性，则直接舍弃帧内预测模式，宏块采用帧间预测模式，须对宏块做运动估计，进入步骤三；否则，判断Th₂是否小于零，若Th₂小于零，说明帧间预测模式的平方差值和大于帧内预测模式的平方差值和，证明宏块的帧内相关性大于帧间相关性，则直接舍弃帧间预测模式，宏块采用帧内预测模式，进入步骤四；否则，说明当前编码宏块时/空相关性特征不显著，不能舍弃帧间/帧内中的任何一种预测模式，先执行帧内预测模式，再进入步骤三；步骤三：确定最佳帧间编码模式，采用拉格朗日率失真优化准则，作为运动估计和模式选择的判决依据，选择率失真意义上的最优帧间编码模式；率失真代价值，即RD cost，可按照下面的公式计算：J_mode(s，c，MODE|λ_mod e)＝SSD(s，c|QP)+λ_mod e×R(s，c，MODE|QP) (5)式中，MODE表示当前编码宏块采用的帧间预测模式；s为原始视频信号；c为采用MODE预测模式编码后的重建视频信号；λ_mod e为拉格朗日乘子；J_mod e(s，c，MODE|λ_moode)表示MODE模式下的率失真代价值RD cost；R(s，c，MODE|QP)是与预测模式和量化参数有关的包含宏块头信息、运动矢量和所有DCT块信息的总的二进制位数；QP是编码量化步长；SSD(s，c|QP)为原始信号与重构信号间的平方差值和；根据宏块平坦度特征，将宏块分类，进而优先选择可能的帧间预测编码模式集合，实现帧间预测模式的快速判决；具体包括以下步骤：1)表征宏块平坦度统计宏块亮度分量包含各灰度级的像素数，得到宏块灰度直方图，其形状恰好反映了宏块图像细节的丰富程度，可用于评价宏块的平坦度；在宏块灰度直方图中，必然存在一个纵坐标最大的灰度级，将属于这个灰度级的像素点总数定义为宏块的最大像素数，记为MaxValue；2)判断宏块类型为降低对特征不明显的宏块做出误判，采用动态双阈值判断宏块类型及其可能采用的帧间预测模式集合，具体过程如下：(1)计算宏块灰度直方图，记录其最大像素数Max Value；(2)设定上限阈值Th_high和下限阈值Th_low，Th_high和Th_low均为[0，255]间的整数；(3)若Max Value＞Th_high，认为宏块平坦，则直接进行大尺寸帧间预测，确定最优帧间预测模式，进入步骤四；(4)若Max Value＜Th_low，认为宏块纹理丰富，则直接进行小尺寸帧间预测，确定最优帧间预测模式，进入步骤四；(5)若Th_low＜Max Value＜Th_high，认为宏块平坦度特征不显著，执行全部帧间预测模式；为使阈值随宏块平坦度的变化而自适应改变，采用以下策略：(1)若当前编码宏块的Max Value大于当前上限阈值Th_high，则更新上限阈值：以此平均值作为新的上限阈值Th_high；(2)若当前编码宏块的Max Value小于当前下限阈值Th_low，则更新下限阈值：以此平均值作为新的下限阈值Th_low；(3)若当前编码宏块的Max Value介于上限阈值Th_high和下限阈值Th_low之间，则保持原上、下限阈值数值不变。步骤四：根据率失真准则，对具有最小率失真代价的预测编码模式下的残差进行变化、量化、熵编码；步骤五：输出最终的压缩视频码流，保存编码信息。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京工业大学，未经北京工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201110098369.7/，转载请声明来源钻瓜专利网。

同类专利

专利分类

H 电学

H04 电通信技术
H04N 图像通信，如电视
H04N7-00 电视系统
H04N7-01 .制式的转换
H04N7-015 .高清晰度电视系统
H04N7-025 .用于非图像数据传输系统，例如在电视帧的有效部分的图文传输
H04N7-04 .传送单一电视信号的系统，即由单一载波传送图像和伴音
H04N7-06 .同时传送单一电视信号的系统，即用一个以上载波传送图像和伴音

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]分层结构预判的快速视频编码方法有效

专利文献下载