[发明专利]一种针对流媒体音频质量的客观评测方法无效

专利信息
申请号: 200910235645.2 申请日: 2009-10-10
公开(公告)号: CN102044248A 公开(公告)日: 2011-05-04
发明(设计)人: 杨越;谢湘;魏耀都 申请(专利权)人: 北京理工大学
主分类号: G10L19/00 分类号: G10L19/00
代理公司: 北京理工大学专利中心 11120 代理人: 张利萍;高燕燕
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 针对 流媒体 音频 质量 客观 评测 方法
【权利要求书】:

1.一种针对流媒体音频质量的客观评测方法,其特征在于:包括以下步骤:

第一步:在发送端获得原始音频,在接收端获得经过网络传输后引入了编解码器、丢包、延时抖动损伤的失真音频;

第二步:针对带有网络特性的失真的音频进行预处理和对齐模块处理后,经过音频质量的感知评估PEAQ输出去掉延时和抖动的失真音频;

第三步:对原始音频和对齐后的失真音频进行编解码器及丢包损伤质量评测;

第四步:对于失真音频和对齐后的失真音频间的延时抖动带来的损伤进行网络损伤评估的客观质量评测;

第五步:把这两部分损伤的质量评测值拟合,得到原始音频和经过网络传输后的失真音频的客观评测值。

2.根据权利要求1所述的一种针对流媒体音频质量的客观评测方法,其特征在于:所述第一步中对其是否有网络延时抖动以及网络延时抖动的大小进行判断方法为:根据网络延时抖动大小定义对齐模块的搜索窗大小,并将其做为对齐模块的初始搜索窗值;并且根据划分的音频段和静默段信息,试验出传输的帧长。

3.根据权利要求1所述的一种针对流媒体音频质量的客观评测方法,其特征在于:所述得对齐模块利用基于帧到帧的互相关的办法,在失真音频中找到对应的帧,下一帧恢复到初始搜索窗值,如此循环,直到在失真音频中找到原始音频的每一帧的对应帧,若没有,则调整初始搜索窗值,继续搜索,直到得到的对齐失真音频的样点数等于原始音频的样点数,并输出对齐后的失真音频。

4.根据权利要求1或2或3所述的一种针对流媒体音频质量的客观评测方法,其特征在于:所述的音频质量的感知评估PEAQ计算采用下述步骤:

第一步:将输入信号从时域变换到听觉域Bark,BV依靠FFT加频域到Bark域映射的方法,AV依靠滤波器组滤波的方法,在映射的过程中,根据还音电平对信号进行幅度调节、利用外中耳模拟函数对信号进行加权;

第二步:按照心理声学理论对表示在Bark域的输入信号进行频域扩散和时域扩散,同时计算遮蔽门限;

第三步:进行幅度和模式调整,并计算失真阈值;

第四步:利用上述三步的输出,按各输出参数的定义计算所有输出参数MOVs;将MOVs通过信息融合的手段合成为评价参数。

5.根据权利要求1或2或3所述的一种针对流媒体音频质量的客观评测方法,其特征在于:所述失真音频和经过对齐模块得到的对齐后的失真音频进行网络延时抖动损伤的评估方法包括以下步骤:

第一步:用基于美尔频率倒谱系数MFCC的动态时间弯折DTW的最小代价,得到基于MFCC的DTW的最小代价映射到MUSHRA主观分值的拟合模型和DTW的最小代价对应的主观分值DTW-ODG;

第二步:用MUSHRA得到的主观分值拟合所述的音频质量的感知评估PEAQ的客观分值ODG和网络延时抖动损伤的客观分值DTW-ODG,得到最终的流媒体音频质量的客观评测分值IP-ODG。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910235645.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top