[发明专利]一种面向压缩失真的立体视频质量客观评价方法有效

专利信息
申请号: 201410612196.X 申请日: 2014-11-04
公开(公告)号: CN104394403A 公开(公告)日: 2015-03-04
发明(设计)人: 蒋刚毅;宋洋;朱宏;刘姗姗;吕亚奇 申请(专利权)人: 宁波大学
主分类号: H04N17/00 分类号: H04N17/00;H04N13/00
代理公司: 宁波奥圣专利代理事务所(普通合伙) 33226 代理人: 周珏
地址: 315211 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种面向压缩失真的立体视频质量客观评价方法,其将立体视频质量分为左右视点质量和深度感知质量两部分,在左右视点质量评价部分,考虑到视频图像受到压缩失真会产生块效应和模糊的特点,提取梯度信息作为图像特征,同时考虑到人眼的时空域视觉特性,从而得到左视点质量和右视点质量;在深度感知质量评价部分,通过三维小波变换提取三维视差空间图中的低频成分,并将其质量作为立体视频的深度感知质量;最后,将左视点质量、右视点质量和深度感知质量相结合,得到最终的失真立体视频质量;优点是从左右视点平面视频质量的角度和立体视频深度感的角度完成对立体视频的客观质量评价,有效地提高了客观评价结果与主观感知之间的相关性。
搜索关键词: 一种 面向 压缩 失真 立体 视频 质量 客观 评价 方法
【主权项】:
一种面向压缩失真的立体视频质量客观评价方法,其特征在于包括以下步骤:①令Vorg表示原始的无失真的立体视频,令Vdis表示待评价的失真的立体视频,将Vorg中的第f帧立体图像记为的左视点图像和右视点图像对应记为将Vdis中的第f帧立体图像记为的左视点图像和右视点图像对应记为其中,1≤f≤Nf,Nf表示Vorg和Vdis各自所包含的立体图像的数量;②利用水平Sobel算子,计算Vorg中的每帧立体图像的左视点图像的水平梯度图,将的水平梯度图记为同样,利用水平Sobel算子,计算Vdis中的每帧立体图像的左视点图像的水平梯度图,将的水平梯度图记为并,利用垂直Sobel算子,计算Vorg中的每帧立体图像的左视点图像的垂直梯度图,将的垂直梯度图记为同样,利用垂直Sobel算子,计算Vdis中的每帧立体图像的左视点图像的垂直梯度图,将的垂直梯度图记为③计算Vorg中的每帧立体图像的左视点图像中的每个像素点的梯度场,将中坐标位置为(u,v)的像素点的梯度场记为<mrow><msubsup><mi>G</mi><mrow><mi>L</mi><mo>,</mo><mi>org</mi></mrow><mi>f</mi></msubsup><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>=</mo><msqrt><msup><mrow><mo>(</mo><msubsup><mi>Gh</mi><mrow><mi>L</mi><mo>,</mo><mi>org</mi></mrow><mi>f</mi></msubsup><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><msubsup><mi>Gv</mi><mrow><mi>L</mi><mo>,</mo><mi>org</mi></mrow><mi>f</mi></msubsup><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup></msqrt><mo>;</mo></mrow>同样,计算Vdis中的每帧立体图像的左视点图像中的每个像素点的梯度场,将中坐标位置为(u,v)的像素点的梯度场记为<mrow><msubsup><mi>G</mi><mrow><mi>L</mi><mo>,</mo><mi>dis</mi></mrow><mi>f</mi></msubsup><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>=</mo><msqrt><msup><mrow><mo>(</mo><msubsup><mi>Gh</mi><mrow><mi>L</mi><mo>,</mo><mi>dis</mi></mrow><mi>f</mi></msubsup><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><msubsup><mi>Gv</mi><mrow><mi>L</mi><mo>,</mo><mi>dis</mi></mrow><mi>f</mi></msubsup><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup></msqrt><mo>;</mo></mrow>其中,u表示像素点的水平坐标位置,v表示像素点的垂直坐标位置,1≤u≤U,1≤v≤V,U表示Vorg和Vdis中的立体图像水平方向上的像素点的数量,V表示Vorg和Vdis中的立体图像垂直方向上的像素点的数量,表示中坐标位置为(u,v)的像素点的像素值,表示中坐标位置为(u,v)的像素点的像素值,表示中坐标位置为(u,v)的像素点的像素值,表示中坐标位置为(u,v)的像素点的像素值;④根据Vorg中的每帧立体图像的左视点图像中的每个像素点的梯度场和Vdis中对应的一帧立体图像的左视点图像中对应坐标位置的像素点的梯度场,确定Vorg中的每帧立体图像的左视点图像中的每个像素点为显著点还是为非显著点,同时确定Vdis中的每帧立体图像的左视点图像中的每个像素点为显著点还是为非显著点,然后获取Vorg中的每帧立体图像的左视点图像的显著点图和Vdis中的每帧立体图像的左视点图像的显著点图,将的显著点图记为的显著点图记为⑤计算Vorg中的每帧立体图像的左视点图像的显著点图与Vdis中对应的一帧立体图像的左视点图像的显著点图之间的差值图,将之间的差值图记为然后利用恰可觉察失真模型,根据Vorg中的每帧立体图像的左视点图像的显著点图与Vdis中对应的一帧立体图像的左视点图像的显著点图之间的差值图,确定Vorg中的每帧立体图像的左视点图像中的每个像素点为可见失真点还是为不可见失真点,同时确定Vdis中的每帧立体图像的左视点图像中的每个像素点为可见失真点还是为不可见失真点;其中,符号“||”为取绝对值符号;⑥将Vorg中的每帧立体图像的左视点图像中的所有可见失真点构成该帧立体图像的左视点图像的感兴趣区域,将Vorg中的每帧立体图像的左视点图像中的所有不可见失真点构成该帧立体图像的左视点图像的不感兴趣区域,将的感兴趣区域记为中的所有可见失真点构成,将的不感兴趣区域记为中的所有不可见失真点构成;同样,将Vdis中的每帧立体图像的左视点图像中的所有可见失真点构成该帧立体图像的左视点图像的感兴趣区域,将Vdis中的每帧立体图像的左视点图像中的所有不可见失真点构成该帧立体图像的左视点图像的不感兴趣区域,将的感兴趣区域记为中的所有可见失真点构成,将的不感兴趣区域记为中的所有不可见失真点构成;⑦根据Vorg中的每帧立体图像的左视点图像的感兴趣区域与Vdis中对应的一帧立体图像的左视点图像的感兴趣区域,计算Vdis中的每帧立体图像的左视点图像的感兴趣区域质量,将的感兴趣区域质量记为其中,SSIM()为结构相似度计算函数;同样,根据Vorg中的每帧立体图像的左视点图像的不感兴趣区域与Vdis中对应的一帧立体图像的左视点图像的不感兴趣区域,计算Vdis中的每帧立体图像的左视点图像的不感兴趣区域质量,将的不感兴趣区域质量记为⑧计算Vdis中的每帧立体图像的左视点图像相对于Vorg中对应的一帧立体图像的左视点图像的初级质量,将相对于的初级质量记为然后计算Vdis中的每帧立体图像的左视点图像相对于Vorg中对应的一帧立体图像的左视点图像的最终质量,将相对于的最终质量记为再计算Vdis的左视点质量,记为QL其中,λ为感知加权因子,表示Vdis中的第f‑1帧立体图像的左视点图像相对于Vorg中的第f‑1帧立体图像的左视点图像的初级质量,a表示相对于下降时的下降质量调节因子,a+表示相对于上升时的上升质量调节因子,表示之间的差异,<mrow><msubsup><mi>d</mi><mi>q</mi><mi>f</mi></msubsup><mo>=</mo><msubsup><mi>q</mi><mi>L</mi><mrow><mo>&prime;</mo><mi>f</mi></mrow></msubsup><mo>-</mo><msubsup><mi>q</mi><mi>L</mi><mrow><mo>&prime;</mo><mi>f</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mo>,</mo></mrow><mrow><msubsup><mi>d</mi><mi>q</mi><mi>f</mi></msubsup><mo>=</mo><msubsup><mi>q</mi><mi>L</mi><mrow><mo>&prime;</mo><mi>f</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mo>-</mo><msubsup><mi>q</mi><mi>L</mi><mrow><mo>&prime;</mo><mi>f</mi><mo>-</mo><mn>2</mn></mrow></msubsup></mrow><mrow><mn>2</mn><mo>&le;</mo><mi>f</mi><mo>&le;</mo><msub><mi>N</mi><mi>f</mi></msub><mo>;</mo></mrow>⑨按照步骤②至步骤⑧的操作,以相同的操作方式对Vorg中的每帧立体图像的右视点图像和Vdis中的每帧立体图像的右视点图像进行处理,获取Vdis的右视点质量,记为QR;⑩根据QL和QR,计算Vdis相对于Vorg的左右视点质量,记为QLR,QLR=ws×QL+(1‑ws)×QR,其中,ws表示QL在QLR中所占的权重;获取Vorg中的每帧立体图像的三维视差空间图,将的三维视差空间图记为<mrow><msubsup><mi>DSI</mi><mi>org</mi><mi>f</mi></msubsup><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>,</mo><mi>d</mi><mo>)</mo></mrow><mo>=</mo><msup><mrow><mo>|</mo><mo>|</mo><msubsup><mi>L</mi><mi>org</mi><mi>f</mi></msubsup><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>-</mo><msubsup><mi>R</mi><mi>org</mi><mi>f</mi></msubsup><mrow><mo>(</mo><mi>u</mi><mo>-</mo><mi>d</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msup><mo>,</mo></mrow>其中,表示中坐标位置为(u,v)的像素点在视差偏移量为d时的视差空间值,d取[1,dmax]中的所有整数,dmax为最大视差搜索范围,符号“|| ||”为欧氏距离计算符号,表示中坐标位置为(u,v)的像素点的像素值,表示中坐标位置为(u‑d,v)的像素点的像素值,为U×V×dmax的三维矩阵;同样,获取Vdis中的每帧立体图像的三维视差空间图,将的三维视差空间图记为<mrow><msubsup><mi>DSI</mi><mi>dis</mi><mi>f</mi></msubsup><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>,</mo><mi>d</mi><mo>)</mo></mrow><mo>=</mo><msup><mrow><mo>|</mo><mo>|</mo><msubsup><mi>L</mi><mi>dis</mi><mi>f</mi></msubsup><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>-</mo><msubsup><mi>R</mi><mi>dis</mi><mi>f</mi></msubsup><mrow><mo>(</mo><mi>u</mi><mo>-</mo><mi>d</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msup><mo>,</mo></mrow>其中,表示中坐标位置为(u,v)的像素点在视差偏移量为d时的视差空间值,d取[1,dmax]中的所有整数,dmax为最大视差搜索范围,符号“|| ||”为欧氏距离计算符号,表示中坐标位置为(u,v)的像素点的像素值,表示中坐标位置为(u‑d,v)的像素点的像素值,为U×V×dmax的三维矩阵;对Vorg中的每帧立体图像的三维视差空间图进行一级三维小波变换,得到Vorg中的每帧立体图像对应的八组子带矩阵,然后将Vorg中的每帧立体图像对应的最低频的一组子带矩阵作为该帧立体图像的低频视差空间图,将的低频视差空间图记为其中,的三维矩阵;同样,对Vdis中的每帧立体图像的三维视差空间图进行一级三维小波变换,得到Vdis中的每帧立体图像对应的八组子带矩阵,然后将Vdis中的每帧立体图像对应的最低频的一组子带矩阵作为该帧立体图像的低频视差空间图,将的低频视差空间图记为其中,的三维矩阵;根据Vorg中的每帧立体图像的低频视差空间图和Vdis中对应的一帧立体图像的低频视差空间图,计算Vdis中的每帧立体图像相对于Vorg中对应的一帧立体图像的深度感知质量,将相对于的深度感知质量记为其中,SSIM()为结构相似度计算函数;根据Vdis中的每帧立体图像相对于Vorg中对应的一帧立体图像的深度感知质量,计算Vdis相对于Vorg的深度感知质量,记为Qd根据QLR和Qd,计算Vdis相对于Vorg的失真立体视频质量,记为Q,Q=wLR×QLR+(1‑wLR)×Qd,其中,wLR为QLR在Q中所占的权重。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410612196.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top