[发明专利]基于心理声学模型的语音后置感知滤波器有效

申请号：	201410046572.3	申请日：	2014-02-10
公开（公告）号：	CN103824562A	公开（公告）日：	2014-05-28
发明（设计）人：	贾海蓉;李鸿燕;武奕峰;张雪英	申请（专利权）人：	太原理工大学
主分类号：	G10L21/0208	分类号：	G10L21/0208
代理公司：	北京方圆嘉禾知识产权代理有限公司 11385	代理人：	董芙蓉
地址：	030024 ***	国省代码：	山西;14
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及基于心理声学模型的语音后置感知滤波器，首先，该感知滤波器不需要融合在各个算法中，因而不会影响算法的复杂度，但是却获得了同样增强听觉感知度的效果。其次，它只是针对增强语音的再次处理的过程，使得增强语音的听觉感知度进一步的提高，即使噪声存在，信噪比没有提高的情况下，利用这个后置的感知滤波器，也能达到提高听觉感知度的目的；该后置感知滤波器是建立在语音信号失真最小的情况下使残留噪声尽可能不被人耳听到的条件下，且滤波器的增益是由在该条件下构建含有掩蔽阈值的代价函数获得，并由掩蔽阈值构建的感知归一化因子进一步优化，目的是避免了过度的削弱信号，保证了增强后语音感知失真最小。
搜索关键词：	基于心理声学模型语音后置感知滤波器
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.基于心理声学模型的语音后置感知滤波器，其特征在于：在所述滤波器中，1)带噪语音经过连续可导的谱减法增强后，根据心理声学模型分帧计算每帧的掩蔽阈值；2)用第一步求解的掩蔽阈值构建代价函数：J＝P(ε_s)+μ(P(ε_r)-E[T_k])＝|G-1|²E[|S_k|²]+μ(|G|²E[|N_k|²]-E[T_k])其中，ε_s＝S_k(G-1)为语音失真，ε_r＝N_kG为残留噪声；E(N_kS_k)＝0，语音失真的功率P(ε_s)、残留噪声的功率P(ε_r)；3)通过使代价函数最下，求解感知滤波器的增益；4)再用感知归一化因子对感知滤波器进行修正，感知归一化因子为：其中，T_min(l)为第1帧中的最小值，T_max(l)为第1帧中的最大值，得到最终的感知滤波器的增益G_k为：Gk=1/max(θ*|Nk|2Tk,1)=1/max(θ*|Nk|Tk,1)]]>5)最后得到增强的语音。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于太原理工大学，未经太原理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201410046572.3/，转载请声明来源钻瓜专利网。

上一篇：基于动态无功设备的电力系统中中枢母线电压的控制方法
下一篇：一种高应力低孔隙率煤层预裂增透抽放瓦斯的方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于心理声学模型的语音后置感知滤波器有效

专利文献下载