[发明专利]一种基于方向梯度统计特征的快速帧内预测模式决策方法在审
| 申请号: | 202011561933.X | 申请日: | 2020-12-25 |
| 公开(公告)号: | CN112770115A | 公开(公告)日: | 2021-05-07 |
| 发明(设计)人: | 王娇娇;姚英彪;杜晨杰;徐欣;冯维;许晓荣 | 申请(专利权)人: | 杭州电子科技大学 |
| 主分类号: | H04N19/11 | 分类号: | H04N19/11;H04N19/593;H04N19/186;H04N19/149 |
| 代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 周希良 |
| 地址: | 310018 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 方向 梯度 统计 特征 快速 预测 模式 决策 方法 | ||
本发明公开一种基于方向梯度统计特征的快速帧内预测模式决策方法,包括步骤:S1、在离线阶段,从N个类型的视频序列中提取训练实例,以组成训练数据集;S2、在离线阶段,利用训练数据集提取编码块CU的特征向量X={SOG,xQstep}和对应的类别标签y,计算局部区域的梯度方向并进行统计,以此作为该局部区域的特征,并将训练数据集划分成训练集、验证集、测试集;S3、在离线阶段,训练各不同大小编码块CU的SVM离线模型;S4、在在线阶段,提取当前待编码块CU的特征向量,并将其输入到步骤S3训练好的对应的SVM模型中,并通过SVM模型预测待编码块CU是否选择Planar模式。本发明在保证视频质量基本不变的前提下,有效地降低了VVC帧内编码时间和复杂度。
技术领域
本发明属于视频压缩技术领域,具体涉及一种基于方向梯度统计特征的快 速帧内预测模式决策方法。
背景技术
高清、超高清及4K视频等超高分辨率视频的出现,一方面,这意味着需 要更大的带宽来传输视频数据,另一方面,也意味着需要更大的存储空间来保 存视频数据。为缓解视频传输、存储对资源的需求,视频编码标准作为视频压 缩技术的一种常用有效手段,目标是在不降低视频解码后的视频质量的条件下, 最大可能地提高视频压缩比。视频编码标准发展历程中,一直都在探索创新中 寻求新的突破,截止目前已经发布了很多不同的版本,最新版本是还在不断完 善中的H.266/VVC(versatile video coding)标准。
VVC预测编码包括帧内预测编码和帧间预测编码。帧内预测编码消除了大 量空域冗余,它是利用同一帧已编码完成的像素点对即将编码的像素点进行预 测。VVC帧内预测模式由H.265原有的35种增加到67种,即DC模式,Planar 平面模式,和65种角度预测模式。预测模式的增加大大提高了帧内预测的准确 性,但同时也带来了非常高的计算复杂度。VVC帧内预测通过采用粗模式选择 (RMD)和最有可能预测模式(MPM)相结合的方法减少率失真优化(RDO)过 程中涉及到的预测模式,从而降低帧内预测编码的复杂度。但即使是这样,VVC 的帧内预测模式仍然涉及到众多的帧内模式选择,运算量非常大。
发明内容
为了降低帧内预测模式决策复杂度,本发明公布了一种基于方向梯度统计 特征(SOG)的H.266/VVC快速帧内编码方法,以解决Planar和非Planar模式的 快速决策。具体来说,用基于梯度方向统计的9维特征向量SOG提取每个编码 块(CU)的信息,然后利用SOG特征,针对每种大小的CU,分别训练了一个支 持向量机(SVM:Support Vector Machine)模型,用于进行Planar和非Planar预测 模式的快速决策。本方法可以在保证编码效果的前提下有效降低编码算法的计 算复杂度。
本发明采用以下技术方案:一种基于方向梯度统计特征的快速帧内预测模 式决策方法,包括步骤:
S1、在离线阶段,从N个类型的视频序列中提取训练实例,以组成训练数 据集;
S2、在离线阶段,利用训练数据集提取编码块CU的特征向量X={SOG,xQstep} 和对应的类别标签y,计算局部区域的梯度方向并进行统计,以此作为该局部区 域的特征,并将训练数据集划分成训练集、验证集、测试集,其中特征SOG反 映了编码块CU的方向特征,xQStep表示量化步长;
S3、在离线阶段,训练各不同大小编码块CU的SVM离线模型;
S4、在在线阶段,提取当前待编码块CU的特征向量,并将其输入到步骤 S3训练好的对应的SVM模型中,并通过SVM模型预测待编码块CU是否选择 Planar模式。
作为优选方案,步骤S1中,N个类型分别是A、B、C、D、E,5个类型, 且该5个类型的视频序列为根据分辨率的不同进行分类,其中A类视频分辨率 是2560×1600,B类视频分辨率是1920×1080,C类视频分辨率是832×480,D类 视频分辨率是416×240,E类视频分辨率是1280×720。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011561933.X/2.html,转载请声明来源钻瓜专利网。





