[发明专利]帧内预测方法、装置、电子设备及机器可读存储介质有效
申请号: | 201810276552.3 | 申请日: | 2018-03-30 |
公开(公告)号: | CN110324620B | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 左旭光 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | H04N19/14 | 分类号: | H04N19/14;H04N19/159;H04N19/182;H04N19/30;G06N3/04 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 310051 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测 方法 装置 电子设备 机器 可读 存储 介质 | ||
本申请提供了帧内预测方法、装置、电子设备及机器可读存储介质。本申请中,并非仅依赖于隐藏层只包含全连接层的深度神经网络实现帧内预测,而是由卷积层或降维处理与全连接层一起实现帧内预测,因为卷积层或降维处理能够帮助全连接层分担帧内预测,因此,相比于仅依赖于隐藏层只包含全连接层的深度神经网络实现帧内预测,本申请中全连接层的层数可以远小于仅依赖于隐藏层只包含全连接层的深度神经网络中全连接层的层数,大大降低帧内预测的复杂度。
技术领域
本申请涉及视频技术,特别涉及帧内预测方法、装置、电子设备及机器可读存储介质。
背景技术
在视频编解码领域,帧内预测技术是一种去除图像内临近像素之间空间相关性(即空域冗余)的技术。
目前,帧内预测是基于深度神经网络实现的。其中,帧内预测基于的深度神经网络包括:输入层、隐藏层、输出层。隐藏层仅包含全连接层。图1示出了基于深度神经网络的帧内预测示意图。如图1所示,对于图1所示的尺寸为NxN的像素块(图1中的白色方框),将与该像素块相邻的区域(图1所示的灰色区域)中的重建像素输入至深度神经网络的输入层,并经过深度神经网络的全连接层(全连接层的最后一层包含NxN个节点)处理,最终由输出层输出像素块的预测块。
虽然基于深度神经网络(隐藏层仅包含全连接层)可实现帧内预测。但是,当通过隐藏层只包含全连接层的深度神经网络实现帧内预测时,常要求全连接层的层数比较多,而全连接层的层数与深度神经网络所需的网络参数成正比例关系,每增加一层全连接层,所需的网络参数会急剧增加,会加大帧内预测复杂度。
发明内容
本申请提供了帧内预测方法、装置、电子设备及机器可读存储介质,以降低帧内预测的复杂度。
本申请提供的技术方案包括:
本申请提供第一种帧内预测方法,包括:
将指定像素块的参考像素输入至第一深度神经网络中的第一全连接层;
依据所述第一全连接层输出的第一数据块确定待输入至卷积层的目标数据块;
将所述目标数据块输入至所述卷积层;
依据所述卷积层输出的第二数据块确定所述指定像素块的预测块。
本申请提供第二种帧内预测方法,包括:
对指定像素块的参考像素进行降维处理得到第七数据块;
将所述第七数据块输入至第二深度神经网络中的第二全连接层;
依据所述第二全连接层输出的第八数据块确定所述指定像素块的预测块。
本申请提供第一种帧内预测装置,包括:
第一全连接模块,用于将指定像素块的参考像素输入至第一深度神经网络中的第一全连接层;
数据处理模块,用于依据所述第一全连接层输出的第一数据块确定待输入至卷积层的目标数据块,将所述目标数据块输入至所述卷积层;
预测模块,用于依据所述卷积层输出的第二数据块确定所述指定像素块的预测块。
本申请提供第二种帧内预测装置,包括:
降维模块,用于对指定像素块的参考像素进行降维处理得到第八数据块;
第二全连接模块,用于将所述第八数据块输入至第二深度神经网络中的第二全连接层;
预测模块,用于依据所述第二全连接层输出的第九数据块确定所述指定像素块的预测块。
本申请提供第一种电子设备,包括:存储器、处理器;
所述存储器,用于存储帧内预测方法对应的机器可读指令;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810276552.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:变换信息预测
- 下一篇:视频编码方法、装置、电子设备和存储介质