[发明专利]基于统计模型的双传感器语音增强方法有效
申请号: | 201910296425.4 | 申请日: | 2016-01-14 |
公开(公告)号: | CN110010149B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 张军;陈鑫源;潘伟锵;宁更新;冯义志;余华;季飞;陈芳炯 | 申请(专利权)人: | 深圳市韶音科技有限公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 李庆波 |
地址: | 518108 广东省深圳市宝安区石*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 统计 模型 传感器 语音 增强 方法 | ||
本发明公开一种基于统计模型的双传感器语音增强方法,包括:同步采集气导检测语音和非气导检测语音,检测气导检测语音的端点,然后利用气导检测语音的纯噪声段建立气导噪声统计模型;利用气导噪声统计模型修正联合统计模型,并对气导检测语音帧进行分类;根据分类结果对应的气导语音线性频谱统计模型和气导噪声统计模型计算最佳气导语音滤波器;利用最佳气导语音滤波器对气导检测语音进行滤波增强后得到滤波增强语音,其中,联合统计模型和气导语音线性频谱统计模型由同步采集的干净的气导训练语音和非气导训练语音预先建立。
技术领域
本发明是申请人于2016年01月14日提出的名为“一种基于统计模型的双传感器语音增强方法与装置”、申请号为201610025390的专利申请的分案申请,本发明涉及数字信号处理领域,特别涉及一种基于统计模型的双传感器语音增强方法。
背景技术
通信是现代人与人之间进行交流的重要手段,而语音作为通信系统中最常见的形式,其质量直接影响了人们获取信息的准确性。语音在传播的过程中,难免受到各种各样环境噪声的干扰,其音质、可懂度都将明显下降,因此在实际应用中往往会利用语音增强技术对噪声环境下的语音进行处理。
语音增强技术能从噪声背景中提取有用的语音信号,是抑制、降低噪声干扰的基本手段。传统的语音增强对象是基于空气传导传感器(如麦克风等)采集的语音信号,根据处理方式的不同,常用的语音增强技术可以分为基于模型的方法和非基于模型的方法两类。非基于模型的增强方法有谱减法、滤波法、小波变换法等,它们通常假定噪声是相对平稳的,当噪声变化过快时,其增强效果并不能令人满意。基于模型的语音增强方法则首先对语音信号和噪声信号建立统计模型,然后通过模型获取干净语音的最小均方误差估计或最大后验概率估计。这类方法能够避免音乐噪声的产生,并能处理非平稳噪声。但由于上述的基于模型和非基于模型的方法均基于麦克风等空气传导语音传感器,其信号容易受环境中的声学噪声影响,特别是在强噪声环境下,系统性能会大幅度下降。
为解决强噪声对语音处理系统的影响,有别于传统的空气传导传感器,非空气传导的语音传感器利用说话人声带、颚骨等部位的振动来带动传感器中的簧片或者碳膜发生变化,改变其电阻值,使其两端的电压发生变化,从而将振动信号转化为电信号,即语音信号。由于空气中传导的声波无法使非空气传导传感器的簧片或者碳膜发生形变,因此非空气传导传感器不受空气传导声音的影响,具有很强的抗环境声学噪声干扰的能力。但因非空气传导传感器采集的是通过颚骨、肌肉、皮肤等的振动传播的语音,表现为发闷、含糊不清,其高频部分丢失严重,语音可懂度较差,制约了非空气传导技术的实际应用。
鉴于空气传导与非空气传导传感器的单独应用都存在一定的缺陷,近年来出现了一些结合两者优点的语音增强方法。这些方法利用空气传导传感器语音和非空气传导传感器语音的互补性,采用多传感器融合技术来实现语音增强的目的,通常能取得比单传感器语音增强系统更好的效果。但现有的空气传导传感器与非空气传导传感器结合的语音增强方法还存在以下不足:(1)空气传导传感器语音与非空气传导传感器语音通常独立地进行恢复处理,然后再将两者恢复后的语音进行融合,未能在空气传导传感器语音和非空气传导传感器语音的恢复过程中充分利用两者之间的互补性;(2)在多变的强噪音环境下,空气传导传感器语音纯语音段的统计特性会被严重干扰,增强语音的信噪比也会降低,导致融合后语音增强效果不明显。
发明内容
本发明提供一种基于统计模型的双传感器语音增强方法,包括:同步采集气导检测语音和非气导检测语音,检测气导检测语音的端点,然后利用气导检测语音的纯噪声段建立气导噪声统计模型;利用气导噪声统计模型修正联合统计模型,并对气导检测语音帧进行分类;根据分类结果对应的气导语音线性频谱统计模型和气导噪声统计模型计算最佳气导语音滤波器;利用最佳气导语音滤波器对气导检测语音进行滤波增强后得到滤波增强语音,其中,联合统计模型和气导语音线性频谱统计模型由同步采集的干净的气导训练语音和非气导训练语音预先建立。
本发明相对于现有技术具有如下的优点及效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市韶音科技有限公司,未经深圳市韶音科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910296425.4/2.html,转载请声明来源钻瓜专利网。