[发明专利]一种无参考源的MP3音频清晰度客观评价方法无效
申请号: | 201010215600.1 | 申请日: | 2010-06-29 |
公开(公告)号: | CN101894560A | 公开(公告)日: | 2010-11-24 |
发明(设计)人: | 余小清;张静;石成林;刘军伟;万旺根 | 申请(专利权)人: | 上海大学 |
主分类号: | G10L19/02 | 分类号: | G10L19/02 |
代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 何文欣 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 参考 mp3 音频 清晰度 客观 评价 方法 | ||
1.一种无参考源的MP3音频清晰度客观评价方法,其特征在于:首先通过对MP3压缩音频部分解码得到修正离散余弦变换系数,其次对这些数据计算频域中高频指数(MHFI),然后选用可能性熵函数作为无参考MP3音频清晰度评价函数,最后对中高频指数的可能性熵值进行统计映射得到清晰度客观评价分值。
2.根据权利要求1所述的一种无参考源的MP3音频清晰度客观评价方法,其特征在于:具体操作步骤如下:
a)MP3压缩音频的预处理:解码帧头,边信息读取,主数据读取,哈夫曼解码和量化;
b)生成修正离散余弦变换MDCT矩阵:找出每一子带中的修正离散余弦变换系数,对子带中系数排列,形成矩阵;
c)压缩域特征参数的提取:中高频指数MHFI,即:每帧压缩域音频信号中高频频率成分的能量与每帧频域总能量的比值:
式中i、j表示边带序号和边带内系数的序号,分子中边带序号i的值可根据选定的中高频频段进行小范围适度调整;M[i][j]为MDCT系数值。
d)计算中高频指数的可能性熵E:
式中k代表不同组份的数目,pi代表第i组份发生的可能性,与香农熵的区别在于:可能性熵不需再满足各组分发生概率之和必须为1的约束;
e)统计映射:将计算所得中高频指数的可能性熵值进行求均统计,并将其映射至0-5区间;
i.求整段音频中高频指数可能性熵的均值EM:
式中:N为音频总的帧数,pi为中高频指数的值,由于每帧包含两个颗粒且测试音频为MP3立体声音频数据,每帧对应四个中高频指数;
ii.将中高频指数可能性熵的均值EM映射至0-5区间;
首先将中高频指数可能性熵的均值进行适度放大,得SII,再通过非线性映射函数将SII值映射至0-5区间,即得清晰度指数值AI,其中常用的映射函数还包括:平方函数、对数函数、截取函数、窗口函数、阈值函数、多值量化函数;
AI=10/π*arctan(SII)
f)输出清晰度分值:即统计映射得到的清晰度指数AI值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010215600.1/1.html,转载请声明来源钻瓜专利网。