[发明专利]语音信号加噪方法、装置及存储介质有效
| 申请号: | 201810948033.7 | 申请日: | 2018-08-20 | 
| 公开(公告)号: | CN108899041B | 公开(公告)日: | 2019-12-27 | 
| 发明(设计)人: | 李超;朱唯鑫 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 | 
| 主分类号: | G10L21/003 | 分类号: | G10L21/003;G10L25/78;G10L21/02 | 
| 代理公司: | 11313 北京市铸成律师事务所 | 代理人: | 王珺;陈建焕 | 
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 语音信号 控制参数 噪声信号 计算机可读存储介质 读取 语音活动检测 信噪比计算 分布特性 语音识别 噪声抑制 信噪比 改进 | ||
本发明实施例提出一种语音信号加噪方法、装置及计算机可读存储介质。其中语音信号加噪方法包括:读取语音信号和噪声信号;产生符合特定分布特性的信噪比;根据所述语音信号的语音活动检测信息、所述噪声信号和所述信噪比计算加噪控制参数;根据所述加噪控制参数和所述噪声信号对语音信号进行加噪处理。本发明实施例改进了加噪控制参数,使加噪方式更加合理,从而使噪声抑制的效果更好,语音识别的性能大大提高。
技术领域
本发明涉及信息技术领域,尤其涉及一种语音信号加噪方法、装置及计算机可读存储介质。
背景技术
语音交互中很重要的一个应用场景就是高噪声情况下的语音识别。在安静情况下,语音识别的准确率已经可以达到97%以上。但是高噪声情况下,人类的听觉系统可以分辨出嘈杂环境中的感兴趣的声音,这个现象叫做“鸡尾酒会效应”。鸡尾酒会效应就是在嘈杂的鸡尾酒会上,还是能够听到感兴趣的目标说话人的声音。
“鸡尾酒会效应”在技术上通常被描述为盲源分离问题,也就是在没有参考信号的情况下,把感兴趣的“前景音”从嘈杂的“背景音”中分离出来。
盲源分离算法的应用场景通常在下面几个方面:
(1)可以将目标说话人的语音从一段多人同时说话的音频中提取出来。例如,客厅里电视正在播放新闻联播,用户想和茶几上智能音箱进行交互。音箱同时接收到了用户的语音请求和新闻联播中主持人的播报。也就是说,同一时刻,两个人在说话,这时需要将用户的语音提取出来。
(2)可以将语音从背景噪声中分离出来。例如,车载环境下的语音识别就属于这种场景。开车的时候,车载信息娱乐产品或者手机的麦克风会接收到各种噪声,如风噪、路噪,鸣笛等,盲源分离算法可以抑制这些环境噪声,只把语音增强取出,送到语音识别系统中。
上面举的例子都是比较理想的情况。盲源分离本身是个回归模型,如果模型性能不理想,就会出现badcase(坏案例)。典型的坏案例有:噪声没有消除干净,语音被损伤了。这个情况最为普遍,也就是在某些时频点,噪声被保留了下来;而在另一些时频点,语音却被消除了。
因此,盲源分离最核心的两个能力是:噪声抑制和不损伤语音。一个好的盲源分离系统,应该能够在尽量少地损伤语音的情况下,把背景噪声抑制到最强程度。
分析了盲源分离算法的上述坏案例可以发现,其中最核心的问题是如何加噪声。当前主要的加噪方式是随机出一个snr(Signal to Noise Ratio,信噪比),按照信噪比计算语音和噪声的能量,然后按照一定的系数加噪。上述加噪的方式比较粗糙。这里有个假设,就是语音文件全部是语音,而噪声文件全部是噪声。待加噪的语音本身可能来自嘈杂的录音环境,它本身就是带噪声的。因此,如果整个语音文件样本不加区分地一起参与计算显然会产生偏差。
发明内容
本发明实施例提供一种语音信号加噪方法、装置及计算机可读存储介质,以至少解决现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种语音信号加噪方法,包括:读取语音信号和噪声信号;产生符合特定分布特性的信噪比;根据所述语音信号的语音活动检测信息、所述噪声信号和所述信噪比计算加噪控制参数;根据所述加噪控制参数和所述噪声信号对语音信号进行加噪处理。
结合第一方面,本发明实施例在第一方面的第一种实现方式中,根据语音信号的语音活动检测信息和所述信噪比计算加噪控制参数,包括采用以下公式计算加噪控制参数:
其中,a表示加噪控制参数;表示语音信号采样值中有声段y的方差;表示语音信号采样值中无声段v的方差;σn表示噪声信号采样值n的标准差;snr表示信噪比;sqrt表示取平方根。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810948033.7/2.html,转载请声明来源钻瓜专利网。





