[发明专利]一种面向多场景的自适应决策树选择的帧间快速预测算法有效
申请号: | 201811287030.X | 申请日: | 2018-10-31 |
公开(公告)号: | CN109361920B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 王健;施腾芮;朱鹏 | 申请(专利权)人: | 南京大学 |
主分类号: | H04N19/103 | 分类号: | H04N19/103;H04N19/159;H04N19/70;H04N19/96 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
地址: | 210093 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 场景 自适应 决策树 选择 快速 预测 算法 | ||
一种面向多场景的自适应决策树选择的帧间快速预测算法,包括以下步骤:1)预备部分:输入一个视频测试序列,对该视频序列中CU帧间预测的各个PU模式进行概率统计,得到帧间预测各个PU模式的概率情况;2)训练部分:分若干个场景类别输入视频测试序列,针对各个场景类别的视频序列收集其CU块的相关特征,将收集到的特征进一步进行筛选和优化,再针对各个场景类别基于优化后的特征生成针对4种8×8、16×16、32×32、64×64不同CU块的决策树;3)执行部分:输入一段由各个场景所组成的视频序列,对输入视频根据视频内场景的变换进行分割,收集各个分割后视频序列CU块的相关特征并进行优化;确定是否继续遍历之后的PU预测模式,帧间预测结束。
技术领域
本发明属于HEVC视频编码领域,具体涉及一种面向多场景HEVC编码单元间利用自适应选择决策树的帧间预测优化编码方法。
背景技术
随着多媒体服务的多元化,如高清视频的普及,超高清分辨率(如4k x 2k,8k x4k等)的出现,对编码性能的要求已经越来越超出H.264的能力范围,渐渐无法满足一些技术或者性能上的需求。为了解决上述问题,动态图像专家组(Moving Picture ExpertsGroup,MPEG)和视频编码专家组(Video Coding Experts Group,VCEG)成立了视频编码联合组(Joint Collaborative Team on Video Coding,JCT-VC)于2013年2月份正式发布了高性能视频编码标准(High Efficiency Video Coding,HEVC)。
HEVC编码器框架采用与H.264/AVC标准类似的预测加变换的混合编码框架,具有帧内预测、帧间运动估计、帧间运动补偿、变换、量化、环路滤波、熵编码等模块。HEVC标准采用了更为灵活有效的块划分结构,引入了编码树单元(Coding Tree Unit,CTU),编码单元(Coding Unit,CU),预测单元(Prediction Unit,PU)和变换单元(Transform Unit,TU)的概念。
此外,编码树块(Coding Tree Block,CTB),编码块(Coding Block,CB),预测块(Prediction Block,PB)和变换块(Transform Block,TB)为与CTU,CU,PU和TU相对应的存储颜色分量的二维矩阵。即一个CTU包含了一个亮度的CTB以及两个色度的CTB。CU,PU和TU也有类似的关系。一个典型的编码过程如下所述:对于输入编码器的每一帧图像,将被分割成为若干个块状的CTU,一个CTU会被分成若干个CU,以此来适应本地不同的内容特性。我们可以将CU、CTU他们两者之间的关系用四叉树来表示,CTU是这棵四叉树的根节点,四叉树结构也称为编码树,被用来将CTU划分成多个CU。
假设CTU的大小为2N×2N,其中N的取值可以为8,16或32,则一个CTU可以单独作为一个CU,或者分成4个大小为N×N的单元,它们都是四叉树的结点。帧间模式可以使用八种划分模式,包括两种正方形形状(PART_2N×2N,PART_N×N),两种长方形形状(PART_2N×N,PART_N×2N),四种非对称形状(PART_2N×nU,PART_2N×nD,PART_nL×2N,PART_nR×2N)。帧间图像的模式判决与率失真代价RDcost有关,模式选择会遍历并计算所有模式的RDcost,最后选取使得RDcost最小的模式为最终模式,这导致极大程度复杂度的上升。因为即使最佳PU预测模式在最前面的几个模式之中,编码器还得继续测完剩余全部的PU预测模式,这就增加了一些不必要的计算。由于帧间模式判断占用了大量的时间,我们需要选择合适的快速模式选择方法来降低编码的计算复杂度。
在CN105791826A李康等人所写的专利中是通过决策树的算法来对帧间预测的模式选择进行判断,而本发明采用自适应选择决策树的方法对帧间预测进行优化,针对多个场景混合的视频序列可以自适应地根据各个场景选用合适的决策树。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811287030.X/2.html,转载请声明来源钻瓜专利网。