[发明专利]基于自然音频统计特性的无参考音频质量评价方法和装置有效
申请号: | 202010171602.9 | 申请日: | 2020-03-12 |
公开(公告)号: | CN111508528B | 公开(公告)日: | 2023-02-28 |
发明(设计)人: | 闵雄阔;翟广涛;杨小康 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/27;G06F17/18 |
代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 刘翠 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 自然 音频 统计 特性 参考 质量 评价 方法 装置 | ||
本发明提供了的一种基于自然音频统计特性的无参考音频质量评价方法,通过将相关的自然图像统计特性推广至自然音频统计,从而实现基于自然音频统计的无参考音频质量评价;本发明所提供的方法包括如下步骤:对输入音频信号进行正则化,利用自然音频统计特性进行建模,提取基于自然音频统计的音频质量特征,特征回归得到最终的音频质量估计。同时提供了一种基于自然音频统计特性的无参考音频质量评价装置。利用本发明提供的基于自然音频统计特性的无参考音频质量评价方法和装置,可有效地在原始音频信号未知的情况下估计待测的音频信号质量。
技术领域
本发明涉及多媒体质量评价技术领域,具体地,涉及一种基于自然音频统计特性的无参考音频质量评价方法和装置。
背景技术
近年来,多媒体质量评价吸引了音频处理和图像处理等领域众多研究者的关注。根据待评价信号的类型,多媒体质量评价可以分为:图像/视频质量评价(image/videoquality assessment)和音频质量评价(audio quality assessment)。因其数量大、信息丰富等特点,图像和视频等视觉信号质量评价受到了更多研究者的关注,并提出了大量的视觉质量评价方法。与视觉质量评价相比,音频质量评价领域受到的关注更少,因此该领域尚缺乏更加深入和广泛的研究。该领域内有一些音频质量评价算法,但是目前仍然缺乏高效的音频质量评价算法,尤其缺乏简单易用且广泛适用于各种类型音频信号的音频质量评价算法。
现有的音频质量评价方法大多基于人类的听觉系统,通过引入复杂的心理声学模型和认知模型来构建音频质量评价模型。例如国际电信联盟在T.Thiede,W.C.Treurniet,R.Bitto,C.Schmidmer,T.Sporer,J.G.Beerends,and C.Colomes,“PEAQ-the ITUstandard for objective measurement of perceived audio quality,”J.AudioEng.Soc.,vol.48,no.1/2,pp.3–29,2000.》中提出的PEAQ(Perceptual Evaluation ofAudio Quality)模型,以心理声学模型为基础,通过信号变换、频带分组、掩蔽计算等方法来模拟人耳对声音产生响应到最终信息感知的过程,具体该方法算法主要有三大组成部分,包括心理声学模型、感知模型和神经网络。参考音频和失真音频分别经过心理声学模型处理后,各自的输出经由感知模型特征综合便可计算出一系列模型输出参数(ModelOutput Variables,MOV),然后由神经网络模块融合这些MOV得到一个描述音频质量的客观差异等级(Objective Difference Grade,ODG)。与PEAQ类似的这类方法很好地模拟了人类的听觉系统,在一定的条件下能够有效地估计音频质量,但是具有可推广性较差的缺点。
Alan Bovik等人在《A.K.Moorthy and A.C.Bovik,“Blind image qualityassessment:From natural scene statistics to perceptual quality,”IEEETrans.Image Process.,vol.20,no.12,pp.3350–3364,Dec.2011.》、《M.A.Saad,A.C.Bovik,and C.Charrier,“Blind image quality assessment:A natural scenestatistics approach in the DCT domain,”IEEE Trans.Image Process.,vol.21,no.8,pp.3339–3352,Aug.2012.》以及《A.Mittal,A.K.Moorthy,and A.C.Bovik,“No-referenceimage quality assessment in the spatial domain,”IEEE Trans.Image Process.,vol.21,no.12,pp.4695–4708,Dec.2012.》中大量利用了自然图像统计来评价图像质量。然而上述方法中的自然图像统计特性仅仅适用于图像及视频,所设计的方法也只能应用于图像和视频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010171602.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种全参考音频质量评价方法及装置
- 下一篇:一种基于区块链的收衣取衣服务系统