[发明专利]基于心理声学模型的语音后置感知滤波器有效
| 申请号: | 201410046572.3 | 申请日: | 2014-02-10 |
| 公开(公告)号: | CN103824562A | 公开(公告)日: | 2014-05-28 |
| 发明(设计)人: | 贾海蓉;李鸿燕;武奕峰;张雪英 | 申请(专利权)人: | 太原理工大学 |
| 主分类号: | G10L21/0208 | 分类号: | G10L21/0208 |
| 代理公司: | 北京方圆嘉禾知识产权代理有限公司 11385 | 代理人: | 董芙蓉 |
| 地址: | 030024 *** | 国省代码: | 山西;14 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明涉及基于心理声学模型的语音后置感知滤波器,首先,该感知滤波器不需要融合在各个算法中,因而不会影响算法的复杂度,但是却获得了同样增强听觉感知度的效果。其次,它只是针对增强语音的再次处理的过程,使得增强语音的听觉感知度进一步的提高,即使噪声存在,信噪比没有提高的情况下,利用这个后置的感知滤波器,也能达到提高听觉感知度的目的;该后置感知滤波器是建立在语音信号失真最小的情况下使残留噪声尽可能不被人耳听到的条件下,且滤波器的增益是由在该条件下构建含有掩蔽阈值的代价函数获得,并由掩蔽阈值构建的感知归一化因子进一步优化,目的是避免了过度的削弱信号,保证了增强后语音感知失真最小。 | ||
| 搜索关键词: | 基于 心理声学 模型 语音 后置 感知 滤波器 | ||
【主权项】:
1.基于心理声学模型的语音后置感知滤波器,其特征在于:在所述滤波器中,1)带噪语音经过连续可导的谱减法增强后,根据心理声学模型分帧计算每帧的掩蔽阈值;2)用第一步求解的掩蔽阈值构建代价函数:J=P(εs)+μ(P(εr)-E[Tk])=|G-1|2E[|Sk|2]+μ(|G|2E[|Nk|2]-E[Tk])其中,εs=Sk(G-1)为语音失真,εr=NkG为残留噪声;E(NkSk)=0,语音失真的功率P(εs)、残留噪声的功率P(εr);3)通过使代价函数最下,求解感知滤波器的增益;4)再用感知归一化因子对感知滤波器进行修正,感知归一化因子为:
其中,Tmin(l)为第1帧中的最小值,Tmax(l)为第1帧中的最大值,得到最终的感知滤波器的增益Gk为:G k = 1 / max ( θ * | N k | 2 T k , 1 ) = 1 / max ( θ * | N k | T k , 1 ) ]]> 5)最后得到增强的语音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410046572.3/,转载请声明来源钻瓜专利网。





