[发明专利]基于自然音频统计特性的无参考音频质量评价方法和装置有效
申请号: | 202010171602.9 | 申请日: | 2020-03-12 |
公开(公告)号: | CN111508528B | 公开(公告)日: | 2023-02-28 |
发明(设计)人: | 闵雄阔;翟广涛;杨小康 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/27;G06F17/18 |
代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 刘翠 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 自然 音频 统计 特性 参考 质量 评价 方法 装置 | ||
1.一种基于自然音频统计特性的无参考音频质量评价方法,其特征在于,包括:
S1:对输入音频信号进行正则化处理,得到正则化后音频信号;
S2:利用自然音频统计特性,对S1中得到的正则化后音频信号进行建模,得到音频信号统计模型;
S3:提取基于S2中得到的自然音频统计模型的音频质量特征;
S4:对S3中得到的音频质量特征进行特征回归操作,得到最终的音频质量估计;
所述S2中,利用自然音频统计特性对正则化后音频信号进行自然音频统计模型建模过程如下:
采用广义高斯分布对正则化后音频信号进行描述:
式中,f(x;α,σ2)表示正则化后音频信号所服从的概率密度函数;x表示正则化后音频信号样本值;α表示一个参数,用于控制分布的形状;σ2用于控制分布的方差;Γ(·)表示如下伽马函数:
β表示以下参数:
采用非对称广义高斯分布,对与正则化后音频信号相邻的两个样本及之间的乘积进行描述:
式中,表示正则化后音频信号相邻样本乘积所服从的概率密度函数,v表示一个参数,用于控制分布的形状;σl表示一个参数,用于控制左侧分布的方差;σr表示一个参数,用于控制右侧分布的方差;βl及βr表示以下参数:
所述S3中,从自然音频统计模型中提取能够描述音频质量的分布参数;其中,广义高斯分布的形状参数α和方差参数σ2用于描述音频质量,非对称广义高斯分布的形状参数v、左方差参数右方差参数及其均值参数η均用于描述音频质量;
其中:
2.根据权利要求1所述的基于自然音频统计特性的无参考音频质量评价方法,其特征在于,所述S1中,对输入音频信号进行正则化处理过程如下:
其中,α(t)为原始音频信号,为正则化之后的音频信号,t为时序索引,c是根据音频信号动态范围设定的一个用于保持除式稳定的常数;μ(t)及σ(t)分别表示音频信号的局部均值及标准差:
其中,wτ,τ=-T,...,T表示一个一维的局部高斯窗。
3.根据权利要求1所述的基于自然音频统计特性的无参考音频质量评价方法,其特征在于,所述S3中,还包括:将输入音频信号下采样,然后提取多个尺度上的音频质量特征。
4.根据权利要求1-3任一项所述的基于自然音频统计特性的无参考音频质量评价方法,其特征在于,所述S4中,对S3中提取的音频质量特征进行特征回归,得到一个描述音频总体质量的单一质量分数。
5.根据权利要求4所述的基于自然音频统计特性的无参考音频质量评价方法,其特征在于,对音频质量特征进行特征回归操作,采用机器学习特征融合方法。
6.根据权利要求5所述的基于自然音频统计特性的无参考音频质量评价方法,其特征在于,所述机器学习特征融合方法采用支持向量机进行特征融合。
7.根据权利要求4所述的基于自然音频统计特性的无参考音频质量评价方法,其特征在于,对音频质量特征进行特征回归操作,采用神经网络的深度学习特征融合方法。
8.一种基于自然音频统计特性的无参考音频质量评价装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时可用于执行权利要求1-7任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010171602.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种全参考音频质量评价方法及装置
- 下一篇:一种基于区块链的收衣取衣服务系统