[发明专利]基于支持向量机的视频转码快速帧内预测方法有效
申请号: | 201010618333.2 | 申请日: | 2010-12-31 |
公开(公告)号: | CN102025999A | 公开(公告)日: | 2011-04-20 |
发明(设计)人: | 贾克斌;吕卓逸;孙中华 | 申请(专利权)人: | 北京工业大学 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N7/50 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 支持 向量 视频 快速 预测 方法 | ||
技术领域
本发明属于数字视频转码技术领域,具体涉及一种基于支持向量机的视频转码快速帧内预测的方法。
背景技术
近年来,多媒体通信随着网络技术的飞速发展广泛融入到社会和个人生活中。由于网络种类的多样性(如Internet网、电信网和蜂窝无线网等),终端设备性能(如显示分辨率、处理能力和存储能力等)的差异,使得提高视频码流在不同应用环境之间的兼容性变得十分重要。转换空间分辨率的视频转码,为支持各类视频显示设备提供了有效的解决方法,它将原始分辨率的视频码流转换为适合接收端显示的目标分辨率码流。H.264在压缩高效性和传输可靠性方面优于其它视频编码标准,并在各个领域中得到了广泛应用,基于H.264的视频编码及转码技术成为近年来国内外研究的热点。
理想的视频转码器应具备低运算复杂度,高转码质量等性能。H.264帧内编码充分利用图像空间相关性,结合率失真优化技术选择最优帧内模式。高效的帧内预测编码极大降低了空间冗余,提高视频编码压缩率,同时也大大增加了编码器的计算复杂度,影响到算法的实时性。因此,如何有效利用输入码流中的编码信息来提高转码速度成为视频转码研究中的关键问题。对此,众多科研人员做了大量工作来优化帧内编码算法。包括降低率失真优化运算复杂度,以及利用边界方向分析宏块特性等等。然而,这些帧内优化算法没有充分利用输入的编码信息来提高转码效率,无法在视频转码中达到理想的效果。因此,如何提高视频转码效率,同时保证图像质量仍然是一个有待探索的课题。
发明内容
本发明的目的是充分利用从输入的高分辨率视频码流中提取的编码信息,组成多维特征向量训练支持向量机(Support Vector Machine,SVM)分类器模型,构建分层式SVM分类器,对降尺寸视频中宏块的帧内预测模式进行分类,降低转码运算复杂度。
为了解决上述技术问题,本发明提供了一种基于支持向量机的视频转码快速帧内预测方法,其特征在于:首先从输入的高分辨率视频码流中提取模式特征组成多维特征向量训练支持向量机(Support Vector Machine,SVM)分类器模型,建立高分辨率视频编码信息与降尺寸视频宏块帧内编码模式之间的相关性。然后设计构建出分层式SVM分类器,对降尺寸视频中宏块的帧内预测模式进行分类,以此减少预测模式数量,实现转码再编码过程中率失真优化算法的提前终止。具体包括下述步骤:
1)将输入的高分辨率视频码流解码来提取编码信息,包括:帧内编码模式、残差宏块和离散余弦变换系数,利用编码信息计算得到表征宏块特征的参量来组成多维特征向量训练支持向量机模型,通过该模型建立高分辨率视频编码信息与降尺寸视频中宏块的帧内编码模式之间的相关性;
2)由顶层分类器,中间层分类器和下层分类器构建成分层式SVM分类器架构,分三步对降尺寸视频中宏块的帧内预测模式进行分类,首先划分Intra 16×16和Intra 4×4,其次对Intra4×4中的模式{0,1,2}和其它模式进行划分,最后划分Intra 4×4中的垂直预测模式和水平预测模式,以此减少预测模式数量;
3)利用缩减后的帧内模式对降尺寸视频进行编码,实现率失真优化算法的提前终止,避免转码中再编码过程中的穷举式全搜索,实现一个低复杂度的H.264视频转码器;
4)输出转码后的低分辨率视频码流。本方法既能够保证转码后视频质量,又有效解决了降尺寸视频转码实时性问题。
在本发明所提供的基于支持向量机的视频转码快速帧内预测方法中,所述的支持向量机特征向量的选取,包括下述步骤:
1)顶层分类器:实验数据表明,在原始高分辨率视频的四个相邻宏块中出现频率最高的编码模式往往就是通过率失真优化算法计算获得的最优编码模式。本方法选择Intra 16×16和Intra 4×4在当前宏块所对应的原始高分辨率视频的四个相邻宏块中的出现次数作为特征向量之一。此外,鉴于残差块不为零的离散余弦变换(DCT)系数的个数(nzcoef)与宏块空间特征的紧密联系,且提取方法简单,无需进行DCT逆变换,因此将不为零的离散余弦变换系数的个数选作顶层分类器的另一个特征向量;
2)中间层分类器:本方法利用如下公式中定义的方向差值参量来衡量宏块的亮度分布特征,进而划分出采用模式{0,1,2}的宏块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010618333.2/2.html,转载请声明来源钻瓜专利网。