[发明专利]视频编码方法、解码方法、电子设备及存储介质在审

申请号：	202210716251.4	申请日：	2022-06-23
公开（公告）号：	CN114979672A	公开（公告）日：	2022-08-30
发明（设计）人：	陈柏林;王钊;叶琰;王诗淇	申请（专利权）人：	阿里巴巴（中国）有限公司
主分类号：	H04N19/85	分类号：	H04N19/85;H04N19/51;H04N19/44
代理公司：	北京合智同创知识产权代理有限公司 11545	代理人：	李杰
地址：	311121 浙江省杭州市余杭***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	视频编码方法解码电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例提供了一种视频编码方法、解码方法及装置。视频编码方法包括：获取原始参考视频帧和待编码的原始目标视频帧；对原始目标视频帧进行分辨率调整，得到具有第一预设分辨率的调整后目标视频帧；并通过与第一预设分辨率对应的特征提取网络对调整后目标视频帧进行特征提取，得到目标特征；分别编码原始参考视频帧和目标特征，得到视频比特流，以基于视频比特流进行视频帧重建，生成与原始目标视频帧具有相同分辨率的重建视频帧。本申请实施例，针对多种不同分辨率的原始目标视频帧，仅需要一套神经网络模型即可进行编解码操作，适用范围更广泛、操作过程更简单、便捷。

技术领域

本申请实施例涉及计算机技术领域，尤其涉及一种视频编码方法、解码方法、电子设备及存储介质。

背景技术

随着计算机技术的不断发展，人们的生活方式也发生了巨大变化。例如：在日常工作及生活中，人们对于视频会议、视频直播的需求不断增加。

视频编解码是实现视频会议、视频直播的关键所在。随着机器学习的不断发展，可采用基于深度视频生成的编解码方法进行视频(尤其是面部视频)的编解码操作，该方法主要通过神经网络模型，基于待编码帧的运动对参考帧进行形变，以得到待编码帧对应的重建帧。上述方法以端到端的方式进行了视频帧的编解码操作，实现了视频帧的重建。

上述基于深度视频生成的编解码方法，一套训练完成的完整神经网络模型，其通常只能用于对具有固定分辨率的待编码视频帧进行视频帧重建，而无法兼容多种不同分辨率。然而，实际应用过程中，由于网络带宽等因素的影响，待编码视频帧的分辨率可能有多种，而并非某一种固定分辨率。此时，只能针对每种分辨率训练一套对应的神经网络模型，再在应用阶段，根据待编码视频帧的实际分辨率加载对应网络模型，这样的操作复杂，非常不方便。

发明内容

有鉴于此，本申请实施例提供一种视频编码方法、解码方法、电子设备及存储介质，以至少部分解决上述问题。

根据本申请实施例的第一方面，提供了一种视频编码方法，包括：

获取原始参考视频帧和待编码的原始目标视频帧；

对所述原始目标视频帧进行分辨率调整，得到具有第一预设分辨率的调整后目标视频帧；并通过与所述第一预设分辨率对应的特征提取网络对所述调整后目标视频帧进行特征提取，得到目标特征；

分别编码所述原始参考视频帧和所述目标特征，得到视频比特流，以基于所述视频比特流进行视频帧重建，生成与所述原始目标视频帧具有相同分辨率的重建视频帧。

根据本申请实施例的第二方面，提供了一种视频解码方法，包括：

获取视频比特流并解码，得到原始参考视频帧和目标特征；

对所述原始参考视频帧进行分辨率调整，得到具有第一预设分辨率的调整后参考视频帧；并通过特征提取网络对所述调整后参考视频帧进行特征提取，得到参考特征；

通过运动估计网络，基于所述参考特征和所述目标特征进行运动估计，得到运动估计结果；

通过生成网络，基于所述运动估计结果和所述原始参考视频帧，生成与所述原始参考视频帧具有相同分辨率的重建视频帧。

根据本申请实施例的第三方面，提供了一种视频编码方法，包括：