[发明专利]语音信号加噪方法、装置及存储介质有效

专利信息
申请号: 201810948033.7 申请日: 2018-08-20
公开(公告)号: CN108899041B 公开(公告)日: 2019-12-27
发明(设计)人: 李超;朱唯鑫 申请(专利权)人: 百度在线网络技术(北京)有限公司
主分类号: G10L21/003 分类号: G10L21/003;G10L25/78;G10L21/02
代理公司: 11313 北京市铸成律师事务所 代理人: 王珺;陈建焕
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音信号 控制参数 噪声信号 计算机可读存储介质 读取 语音活动检测 信噪比计算 分布特性 语音识别 噪声抑制 信噪比 改进
【说明书】:

发明实施例提出一种语音信号加噪方法、装置及计算机可读存储介质。其中语音信号加噪方法包括:读取语音信号和噪声信号;产生符合特定分布特性的信噪比;根据所述语音信号的语音活动检测信息、所述噪声信号和所述信噪比计算加噪控制参数;根据所述加噪控制参数和所述噪声信号对语音信号进行加噪处理。本发明实施例改进了加噪控制参数,使加噪方式更加合理,从而使噪声抑制的效果更好,语音识别的性能大大提高。

技术领域

本发明涉及信息技术领域,尤其涉及一种语音信号加噪方法、装置及计算机可读存储介质。

背景技术

语音交互中很重要的一个应用场景就是高噪声情况下的语音识别。在安静情况下,语音识别的准确率已经可以达到97%以上。但是高噪声情况下,人类的听觉系统可以分辨出嘈杂环境中的感兴趣的声音,这个现象叫做“鸡尾酒会效应”。鸡尾酒会效应就是在嘈杂的鸡尾酒会上,还是能够听到感兴趣的目标说话人的声音。

“鸡尾酒会效应”在技术上通常被描述为盲源分离问题,也就是在没有参考信号的情况下,把感兴趣的“前景音”从嘈杂的“背景音”中分离出来。

盲源分离算法的应用场景通常在下面几个方面:

(1)可以将目标说话人的语音从一段多人同时说话的音频中提取出来。例如,客厅里电视正在播放新闻联播,用户想和茶几上智能音箱进行交互。音箱同时接收到了用户的语音请求和新闻联播中主持人的播报。也就是说,同一时刻,两个人在说话,这时需要将用户的语音提取出来。

(2)可以将语音从背景噪声中分离出来。例如,车载环境下的语音识别就属于这种场景。开车的时候,车载信息娱乐产品或者手机的麦克风会接收到各种噪声,如风噪、路噪,鸣笛等,盲源分离算法可以抑制这些环境噪声,只把语音增强取出,送到语音识别系统中。

上面举的例子都是比较理想的情况。盲源分离本身是个回归模型,如果模型性能不理想,就会出现badcase(坏案例)。典型的坏案例有:噪声没有消除干净,语音被损伤了。这个情况最为普遍,也就是在某些时频点,噪声被保留了下来;而在另一些时频点,语音却被消除了。

因此,盲源分离最核心的两个能力是:噪声抑制和不损伤语音。一个好的盲源分离系统,应该能够在尽量少地损伤语音的情况下,把背景噪声抑制到最强程度。

分析了盲源分离算法的上述坏案例可以发现,其中最核心的问题是如何加噪声。当前主要的加噪方式是随机出一个snr(Signal to Noise Ratio,信噪比),按照信噪比计算语音和噪声的能量,然后按照一定的系数加噪。上述加噪的方式比较粗糙。这里有个假设,就是语音文件全部是语音,而噪声文件全部是噪声。待加噪的语音本身可能来自嘈杂的录音环境,它本身就是带噪声的。因此,如果整个语音文件样本不加区分地一起参与计算显然会产生偏差。

发明内容

本发明实施例提供一种语音信号加噪方法、装置及计算机可读存储介质,以至少解决现有技术中的一个或多个技术问题。

第一方面,本发明实施例提供了一种语音信号加噪方法,包括:读取语音信号和噪声信号;产生符合特定分布特性的信噪比;根据所述语音信号的语音活动检测信息、所述噪声信号和所述信噪比计算加噪控制参数;根据所述加噪控制参数和所述噪声信号对语音信号进行加噪处理。

结合第一方面,本发明实施例在第一方面的第一种实现方式中,根据语音信号的语音活动检测信息和所述信噪比计算加噪控制参数,包括采用以下公式计算加噪控制参数:

其中,a表示加噪控制参数;表示语音信号采样值中有声段y的方差;表示语音信号采样值中无声段v的方差;σn表示噪声信号采样值n的标准差;snr表示信噪比;sqrt表示取平方根。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810948033.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top