[发明专利]基于SSIM评价的容错率失真优化视频编码方法、装置有效
申请号: | 201210113131.1 | 申请日: | 2012-04-17 |
公开(公告)号: | CN102647591A | 公开(公告)日: | 2012-08-22 |
发明(设计)人: | 刘延伟;赵平华;要瑞宵;慈松;唐晖 | 申请(专利权)人: | 中国科学院声学研究所 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N7/64;H04N7/68 |
代理公司: | 北京亿腾知识产权代理事务所 11309 | 代理人: | 陈霁 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 ssim 评价 容错 失真 优化 视频 编码 方法 装置 | ||
技术领域
本发明涉及无线通信视频编码领域,特别涉及一种基于主观视觉SSIM评价的容错率失真优化视频编码方法、装置。
背景技术
随着无线网络技术的快速发展,无线多媒体的应用得越来越广泛,例如无线视频会议系统,无线视频监控等。由于无线网络固有的不稳定,易出错的特性,为无线视频的传输质量带来了很大的影响。为提高视频传输质量,联合信源信道的方法可以相对有效的提高视频传输的质量。目前,联合信源信道编码主要采用基于MSE失真描述的率失真优化,控制端到端的视频失真。这主要是延续了H.264编码中的率失真优化的思路。H.264/AVC标准其较好地编码性能得益于它所采用的率失真优化(rate-distortion optimization,RDO)模型与一系列的编码模式等。RDO中所采用的客观的失真描述方式(如SAD,MSE等)具有计算简单实现简单的优点,但其并不能很好的体现人的视觉特性,因此H.264/AVC中已有的RDO模型并没有很好的考虑到人类的视觉特性。
近年来的研究表明,SSIM在视频质量评价中相对于以往的失真评价方法在人类视觉特性匹配上具有一定的优越性。将SSIM引入到了H.264/AVC编码的预测模式和宏块模式选择中,实验结果表明SSIM的引入在一定程度上提高了编码性能,较以往的SAD等失真描述方式,在相同的码率下,更能够提高人视觉感知到的视频质量。
虽然SSIM作为RDO模式选择的失真度量被引入到了H.264/AVC的编码过程中,提高了编码后的重构视频的视觉感知质量,但他们都没有考虑到由于传输和解码端错误隐藏所导致的视频主观质量的下降,因此不考虑信道导致主观SSIM失真的率失真优化编码方法,并不能很好的控制和适应无线传输过程中引起的端到端的视频质量下降。
发明内容
针对上述问题,本发明的目的在于提供一种基于主观视觉结构相似性SSIM评价的容错率失真优化视频编码方法、装置。
在第一方面,本发明实施例提供一种基于结构相似性SSIM主观评价的容错率失真视频编码方法,所述方法包括:在编码端进行基于SSIM评价的端到端主观失真估计,所述端到端指编码端到视频传输后的解码端;根据帧内或帧间编码模式,计算编码该模式需要的比特数;通过计算容错拉格朗日因子,进行视频容错编码的率失真优化,在易出错网络传输的情况下找到最优的编码模式;采用所述最优的编码模式进行容错率失真优化的联合信源信道编码。
在第二方面,本发明实施例提供一种基于结构相似性SSIM主观评价的容错率失真视频编码装置,所述装置包括:失真估计模块,用于在编码端进行基于SSIM评价的端到端主观失真估计,所述端到端指编码端到解码端;比特数计算模块,用于根据帧内或帧间编码模式,计算编码该模式需要的比特数;最优编码模式确定模块,用于通过计算容错拉格朗日因子,进行视频容错编码的率失真优化,在易出错网络传输的情况下找到最优的编码模式;编码模块,用于采用最优的编码模式进行容错率失真优化的联合信源信道编码。
本发明实施例的方案,借助信道导致主观SSIM失真的率失真优化编码,能较好控制和适应无线传输过程中引起的端到端的视频质量下降。
附图说明
下面结合附图,对本发明的具体实施方案做进一步的详细描述,附图中:
图1是端到端SSIM失真示意图;
图2是基于主观SSIM失真评价的容错率失真优化编码流程;
图3是基于主观SSIM失真评价的容错率失真优化编码装置示意图。
具体实施方式
本发明的目的在于,解决如何利用SSIM指导,进行主观容错率失真优化的联合信源信道编码,提高无线视频传输的主观质量,保证客户端得到较高的视频服务质量。
为了实现上述发明目的,本发明提供了一种基于SSIM评价的主观容错率失真优化的方法。该方法通过估计端到端SSIM失真,并结合编码的码率以及容错率失真优化的拉格朗日优化算子,进行率失真优化的编码模式选择,进而实现一种主观率失真优化的联合信源信道编码方法,优化无线视频的传输质量。
所述的一种基于SSIM评价的主观容错率失真优化的视频编码方法。该方法通过利用信道信息反馈,估计视频的丢包率,然后利用逐像素递归的方法估计当前编码块的端到端主观SSIM失真。通过编码码率和失真的平衡,找到最优的编码模式。率失真的平衡主要是通过拉格朗日因子来计算码率失真代价的形式来实现的。所提出的方法主要包含以下步骤,
步骤1):在编码端进行基于SSIM评价的端到端失真估计,采用如下公式进行估计:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210113131.1/2.html,转载请声明来源钻瓜专利网。