[发明专利]一种H.265超高清视频质量评价方法有效
申请号: | 201910637501.3 | 申请日: | 2019-07-15 |
公开(公告)号: | CN110505472B | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 金伟正;王子轩;叶欣雨;冯方舟;徐卓 | 申请(专利权)人: | 武汉大学 |
主分类号: | H04N17/00 | 分类号: | H04N17/00;G06T7/90;G06F17/16 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 薛玲 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 265 超高 视频 质量 评价 方法 | ||
1.一种基于H.265的超高清视频质量评价方法,其特征在于,包括以下步骤:
步骤1:对原视频进行YUV采样,得到原始视频序列;
步骤2:对原视频序列和测试视频序列进行视频质量评价,计算视频质量参数;
步骤3:统一的视频质量评价参数;
步骤4:根据视频质量参数得出评价结果;
步骤2中所述计算视频质量参数的具体实现如下:
步骤2.1,计算峰值信噪比;
两个M×N色度图像I(i,j)和I'(i,j),如果一个与另外一个的噪声近似,那么二者的的均方差定义为:
其中,M为色度图像的行数,N为色度图像的列数,
峰值信噪比为:
其中,n是每个采样值的比特数;
步骤2.2,计算结构相似性系数;
首先,对于两个M×N色度图像I(i,j)和I'(i,j),以平均色度来作为亮度测量的估计:
其中,N为色度图像的列数,μI为色度图像I(i,j)的平均色度,μI'为色度图像I'(i,j)的平均色度,输入的图像数据组是I,每个点的色度可以用Ii,j表示,Ii表示第i行色度;
然后,由测量系统知道要把平均色度值从信号中去除,对于离散信号,可使用标准差来做对比度估量值:
其中,N为色度图像的列数,σI为色度图像I(i,j)的标准差,σI'为色度图像I'(i,j)的标准差,输入的图像数据组是I,每个点的色度可以用Ii,j表示,Ii表示第i行色度;
亮度对比函数:
其中,C1为
对比度对比函数:
其中,C2为
结构对比函数:
其中,C3为,σII'为色度图像I(i,j)和色度图像I'(i,j)的协方差:
其中C1,C2,C3分别为常数,输入的图像数据组是I,每个点的色度可以用Ii,j表示,Ii表示第i行色度;
最后把三个函数组合起来,得到结构相似性指数函数为:
SSIM(I,I')=[L(I,I')][C(I,I')][S(I,I')]
步骤2.3,MS-SSIM多层级结构相似性
宽高以2M-1为因子进行缩小,当M=1时,表示原始图像大小;当M=2时,表示原始图像缩小一半,以此类推,结构相似性系数为:
步骤2.4,BRISQUE无参考图像空域质量评价;
使用亮度归一化这种方式对图像进行预处理后,图像的MSCN系数的分布将具有显著的统计规律.这种非线性处理方式模拟了人类视觉系统中特有的自适应增益控制前端中心环绕模型,从MSCN系数分布中提取的NSS特征可以有效地应用于图像质量评价;
MSCN系数的计算方法为:
其中,M为色度图像行的数量,N为色度图像列的数量,I(i,j)是大小M×N的色度图像,i∈1,2,···,M,j∈1,2,···,N;μ(i,j)为色度图像的均值,σ(i,j)为色度图像的方差;
C为常量,用于避免图像因局部区域方差为零造成的不稳定情况;ωk,l是二维高斯加权函数,K是高斯窗口的长,L是高斯窗口的宽;
使用零均值GGD模型为MSCN系数分布建模,将模型参数(α',σ2)作为图像的特征,计算方法为:
其中,
其中,α'和σ2分别用于控制广义高斯分布的形状和方差;当α'=1时,为拉普拉斯分布,图像更趋近于拉普拉斯分布;时,α'=2为高斯分布;α'→∞时,为均匀分布;
MSCN相邻系数之间具有一定的结构特性,基于此可以获得失真图像中的降质信息;图像在水平H在方向上MSCN相邻系数的乘积、图像在垂直V在方向上MSCN相邻系数的乘积、图像在主对角线Dm在方向上MSCN相邻系数的乘积和图像在次对角线Ds方向上MSCN相邻系数的乘积分别为:
H(i,j)=In(i,j)In(i,j+1),
V(i,j)=In(i,j)In(i+1,j),
Dm(i,j)=In(i,j)In(i+1,j+1),
Ds(i,j)=In(i,j)In(i+1,j-1).
上述乘积的统计分布可以使用零均值AGGD模型拟合:
其中,
α”用于控制MSCN相邻系数乘积分布的形状,σ1反映分布左侧不同的衰减程度,σr反映分布右侧不同的衰减程度;AGGD模型参数作为图像特征进行图像质量评价;
步骤2.5,VIFP基于像素的视觉信息保真度;
VIFP依赖于自然场景统计模型、图像信号失真通道和人眼视觉失真模型;其计算如下:
其中,I(C;E|z)和I(C;F|z)分别表示人眼能够理想的从输入图像和输出图像特定子带中提取的信息,I(C;E|z)解释为输入图像信息内容,I(C;F|z)解释为输入图像和输出图像的互信息值,该值在视觉上从输出图像相对于输入图像中出现的信息内容中提取,由于各小波子带相互独立,则两种信息测量的比例能够扩展到多个子带,和分别是第k个子带相应的互信息测量,其中k是子带数;
步骤2.6,PSNR-HVS符合人眼视觉特性的峰值信噪比;
由于上面的PSNR计算方法没有考虑人眼视觉系统(Human Visual System,HVS)的特点,导致MSE相同或值相差不大的图片,图片质量却又很大差别,因此采用了考虑对比度敏感度函数和HVS的PSNR计算方法;
对于两个M×N图像PSNR-HVS的计算公式如下:
其中,n是每个采样值的比特数,考虑HVS特征MSEH公式如下:
其中,I,J表示图像块的尺寸,X[m,n]i,j为I×J块图像块的DCT系数,是原始图片对应图像块的DCT系数,Yc是校正因子矩阵,I,J为图像块的尺寸,将图像分为小子块;
步骤2.7,PSNR-HVSM;
PSNR-HVSM与PSNR-HVS的定义方式类似,但在DCT系数上每8x8的区域乘以对比度掩蔽(CM),其公式如下:
其中,I,J表示图像块的尺寸,X[m,n]i,j为I×J块图像块的DCT系数,是原始图片对应图像块的DCT系数,Yc是校正因子矩阵;
步骤3中所述统一视频质量评价参数的具体实现如下:
先将步骤2中参数进行归一化处理,
SSIM1=SSIM
MS-SSIM1=MS-SSIM
其中,PSNR1为归一化后峰值信噪比;SSIM1为归一化后结构相似性系数;MS-SSIM1为归一化多层级结构相似性;
鉴于失真图像MSCN系数的分布存在一定程度的偏移,使用非零均值GGD模型对MSCN系数的分布进行拟合;
其中,α用于控制广义高斯分布的形状,σ2用于控制广义高斯分布的方差,μ为均值,对应峰值点的横坐标,表征分布的偏移程度,当时μ≠0,表示分布存在偏移,模型参数(α,σ2,μ)作为图像的特征;
失真图像在4个方向上的MSCN相邻系数乘积的分布也存在不同程度的偏移,使用非零均值AGGD模型对其进行拟合:
其中,α”反映MSCN相邻系数分布乘积的形状,σl对应分布左不同的衰减程度,σr对应分布右侧不同的衰减程度,μ为均值,对应峰值点的横坐标,作为图像特征;
为量化自然图像邻域像素之间的相似性,分别计算图像中直接相邻像素在水平方向上MSCN相邻系数的全局相关系数即Ch、图像中直接相邻像素垂直方向上MSCN相邻系数的全局相关系数即Cv、图像中直接相邻像素主对角线方向上MSCN相邻系数的全局相关系数即Cm、图像中直接相邻像素次对角线方向上MSCN相邻系数的全局相关系数Cs:
Ch=P(In(1:M,1:N-1),In(1:M,2:N))
Cv=P(In(1:M-1,1:N),In(2:M,1:N))
Cm=P(In(1:M-1,1:N-1),In(2:M,2:N))
Cs=P(In(2:M,1:N-1),In(1:M,2:N))
VIFP1=VIFP
PSNR1,SSIM1,MS-SSIM1,VIFP1,PSNR-HVS1,PSNR-HVSM1参数区间都在(0,1)内,可将其进行相加取平均值,即
(PSNR1+SSIM1+MS-SSIM1+VIFP1+PSNR-HVS1+PSNR-HVSM1)/6
其中,其中,PSNR1为归一化后峰值信噪比;SSIM1为归一化后结构相似性系数;MS-SSIM1为归一化多层级结构相似性;VIFP1为归一化基于像素的视觉信息保真度;PSNR-HVS1为归一化的符合人眼视觉特性的峰值信噪比;PSNR-HVSM1为归一化的基于空间的峰值信噪比;
步骤4中所述根据视频质量参数得出评价结果为:
该平均值数值:
(PSNR1+SSIM1+MS-SSIM1+VIFP1+PSNR-HVS1+PSNR-HVSM1)/6
越大代表视频质量越好,理论最佳质量即原视频得出结果为1;
步骤1中所述YUV采样具体方法为:
通过自适应的采样方法,通过对色度和饱和度的离散程度计算,自动匹配适宜的采样格式;
YUV主要的采样格式为:YCbCr 4:4:4、YCbCr 4:2:2、YCbCr 4:1:1、YCbCr 4:2:0,四种采样格式的不同在于丢弃了多少色度信息和饱和度信息;
对于色度(U),饱和度(V)计算局部标准差,对应每一个4×4的区域内:
在上式结果中,考虑该结果矩阵中数值高于阈值64的概率GCP(Gaily-ColouredProbability),若超过68%,视为变化非常大;若低于34%,视为几乎没有变化;若两个结果相差较大即色度与饱和度,一个超过68%而另一个低于34%,则视为在某一项上会有较多信息;
当色度和饱和度在大部分4×4的区域内变化非常大的时候应采用YCbCr 4:4:4的格式;
当色度和饱和度在大部分4×4的区域内变化比较大的时候应采用YCbCr 4:2:2的格式;
当色度和饱和度在大部分4×4的区域内几乎没有变化的时候应采用YCbCr 4:1:1的格式;
如果色度和饱和度在某一项上会有较多信息的时候应采用YCbCr 4:2:0的格式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910637501.3/1.html,转载请声明来源钻瓜专利网。