[发明专利]一种基于听觉感知特性的语音质量客观评估的方法有效
申请号: | 201410696773.8 | 申请日: | 2014-11-27 |
公开(公告)号: | CN104485114B | 公开(公告)日: | 2018-03-06 |
发明(设计)人: | 李庆先;刘良江;卞昕;柏文琦;周鑫;彭正梁;徐昱 | 申请(专利权)人: | 湖南省计量检测研究院;中国计量科学研究院 |
主分类号: | G10L25/60 | 分类号: | G10L25/60 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410014 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 听觉 感知 特性 语音 质量 客观 评估 方法 | ||
1.一种基于听觉感知特性的语音质量客观评估的方法,其特征在于:所述方法通过在频谱映射为巴克谱模块加入Gammatone滤波器组进行滤波,具体步骤为:
1)通过POLQA处理参考信号和劣化信号,然后所述参考信号和劣化信号进入核心模型;
2)在所述核心模型中的频谱映射为巴克谱模块加入Gammatone滤波器组进行滤波,再进行听觉变换,使提取的听觉频谱更接近人耳听觉感受;
3)通过听觉变换后,再进行干扰分析,分析所述劣化信号相对所述参考信号的失真,得出客观评价MOS分。
2.根据权利要求1所述的一种基于听觉感知特性的语音质量客观评估的方法,其特征在于:所述Gammatone滤波器是一个标准的耳蜗听觉滤波器,滤波器的时域脉冲响应为:
g(t)=Bntn-1e-2πBtcos(2πf0t+φ)u(t) (1)
其中:t<0时u(t)=0,t>0时u(t)=1;参数B=b1ERB(f0),ERB(f0)为Gammatone滤波器的等价矩形带宽,所述等价矩形带宽(ERB):对于同样的白噪声输入,和指定的滤波器通过一样能量的矩形滤波器的宽度,所述等价矩形带宽同Gammatone滤波器中心频率f0的关系是ERB(f0)=24.7+0.108f0。
3.根据权利要求2所述的一种基于听觉感知特性的语音质量客观评估的方法,其特征在于:所述参数优先b1=1.019,n=4。
4.根据权利要求3所述的一种基于听觉感知特性的语音质量客观评估的方法,其特征在于:所述滤波器的时域脉冲响应进行Fourier变换,可得到Gammatone滤波器的时域脉冲响应的频率响应特性,所述Gammatone滤波器的时域波形是一个振动频率等于其中心频率、振动包络为Gamma函数曲线的波形;中心频率越高,达到最大振幅所需要的时间τ也越短。
5.根据权利要求4所述的一种基于听觉感知特性的语音质量客观评估的方法,其特征在于:所述最大振幅出现在中心频率位置的带通滤波器,不同中心频率的Gammatone滤波器具有不同的带宽,带通滤波器中心频率两侧都具有较陡的边沿。
6.根据权利要求1所述的一种基于听觉感知特性的语音质量客观评估的方法,其特征在于:所述POLQA处理的步骤如下:
1)将参考信号和劣化信号的时间对齐,以确保接下来在核心模型中的处理是基于两个信号在相同的语音段的准确比较;
2)在进行时间对齐之后,如果检测到两个信号的采样率不同,则减小较高采样率的信号的采样率,直到达到允许的采样率差;
3)在信号对齐步骤后,所述参考信号和劣化信号进入POLQA的核心模型,所述参考信号和劣化信号被转换成接近人耳听觉特性的语音内部表现形式,在此基础上分析所述参考信号和劣化信号的差异。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南省计量检测研究院;中国计量科学研究院,未经湖南省计量检测研究院;中国计量科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410696773.8/1.html,转载请声明来源钻瓜专利网。