[发明专利]基于音频信号特性分类的无参考音频质量评价方法和系统有效
| 申请号: | 201410196690.2 | 申请日: | 2014-05-09 |
| 公开(公告)号: | CN103957216B | 公开(公告)日: | 2017-10-03 |
| 发明(设计)人: | 胡瑞敏;杨玉红;王衍业;谢松波;董少龙;余洪江;高丽;王晓晨;涂卫平;高戈 | 申请(专利权)人: | 武汉大学 |
| 主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L12/26;G10L25/60;G10L25/69 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙)42222 | 代理人: | 胡艳 |
| 地址: | 430072 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 音频 信号 特性 分类 参考 质量 评价 方法 系统 | ||
技术领域
本发明涉及音频质量评价领域,尤其涉及一种基于音频信号特性分类的无参考音频质量评价方法和系统。
背景技术
随着人们生活质量提高,人们对音频有了更高、更多样化的需求,手机上移动音频点播、音频信息和音乐这样的移动音频服务正在快速增长,为了保证用户在音频服务上的良好体验,音频质量评价必不可少。音频质量评价分为主观质量评价和客观质量评价,主观质量评价虽然更能反映用户体验,但是费时、费力,也不适合实时传输,实际应用中往往采用客观质量评价。客观质量评价又分为有参考质量评价和无参考质量评价,有参考质量评价需要原始音作为参考,能够较为准确预测音频质量,但是实际通信时,特别是移动通信环境下,原始音往往不能够获得,此时,就需要无参考质量评价。
现有的无参考音频质量评价都是通过统计网络参数获得,如丢包和延迟,最有代表性的是E-Model模型,但是均未考虑用户对不同类型音频信号感知失真的差异性。
发明内容
针对现有技术存在的不足,本发明提出了一种基于音频信号特性分类的无参考音频质量评价方法和系统,本发明方法和系统考虑了用户对不同类型音频信号感知失真的差异性,可更真实的反应用户体验。
为解决上述问题,本发明采用如下的技术方案:
一、音频信号特性分类的无参考音频质量评价方法,包括步骤:
步骤1,基于有参考音频质量评价模型建立训练模型,采用机器学习获取不同类型音频信号的音频质量与网络参数的关系,即无参考音频质量评价模型,所述的网络参数包括延迟时间和丢包率;
步骤2,在音频信号网络传输中,将当前丢包率、当前延迟时间和当前丢包数据的音频信号类型输入无参考音频质量评价模型,获得当前音频质量。
步骤1进一步包括子步骤:
1.1将原始音经编码、丢包、解码后得到降质音频,利用有参考音频质量评价模型对降质音频进行质量评价得到客观质量得分MOS;
1.2将降质音频延迟产生延迟损伤,在客观质量得分MOS上减去延迟损伤Id,得到音频质量MOSc;
1.3以音频质量MOSc为目标,以延迟时间、丢包率、音频信号类型为输入,通过机器学习方式获得不同类型音频信号的音频质量与网络参数的关系,即无参考音频质量评价模型。
步骤2进一步包括子步骤:
2.1采用不同编码模式分别对不同类型音频信号进行编码获得音频编码信息;
2.2对音频编码信息进行解码,并统计当前丢包率和当前延迟时间,恢复丢包数据的编码模式,获取当前丢包数据的音频信号类型;
2.3将当前丢包率、当前延迟时间和当前丢包数据的音频信号类型输入无参考音频质量评价模型,获得当前音频质量MOSc。
上述音频信号特性分类的无参考音频质量评价方法还包括步骤:
根据当前音频质量调整延迟时间和编码码率,使当前音频质量取最大值。
二、一种音频信号特性分类的无参考音频质量评价系统,包括:
训练模块,基于有参考音频质量评价模型建立训练模型,采用机器学习获取不同类型音频信号的音频质量与网络参数的关系,即无参考音频质量评价模型,所述的网络参数包括延迟时间和丢包率;
质量评价模块,用来在音频信号网络传输中,将当前丢包率、当前延迟时间和当前丢包数据的音频信号类型输入无参考音频质量评价模型,获得当前音频质量。
上述训练模块进一步包括子模块:
有参考音频质量评分模块,用来将原始音经编码、丢包、解码后得到降质音频,利用有参考音频质量评价模型对降质音频进行质量评价得到客观质量得分MOS;
音频质量评分模块,用来将降质音频延迟产生延迟损伤,在客观质量得分MOS上减去延迟损伤Id,得到音频质量MOSc;
机器学习模块,用来以音频质量MOSc为目标,以延迟时间、丢包率、音频信号类型为输入,通过机器学习方式获得不同类型音频信号的音频质量与网络参数的关系,即无参考音频质量评价模型。
上述质量评价模块进一步包括子模块:
编码模块,用来采用不同编码模式分别对不同类型音频信号进行编码获得音频编码信息;
网络参数和音频信号类型获得模块,用来对音频编码信息进行解码,并统计当前丢包率和当前延迟时间,恢复丢包数据的编码模式,获取当前丢包数据的音频信号类型;
质量评价模块,用来将当前丢包率、当前延迟时间和当前丢包数据的音频信号类型输入无参考音频质量评价模型,获得当前音频质量MOSc。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410196690.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种使热封面温度均匀的结构
- 下一篇:阀门的组装件、汽车及其后桥制动系统





