[发明专利]一种语音处理方法、装置和存储介质在审
| 申请号: | 201910955242.9 | 申请日: | 2019-10-09 |
| 公开(公告)号: | CN112634921A | 公开(公告)日: | 2021-04-09 |
| 发明(设计)人: | 高星;赵立军 | 申请(专利权)人: | 北京中关村科金技术有限公司 |
| 主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L15/22 |
| 代理公司: | 北京万思博知识产权代理有限公司 11694 | 代理人: | 刘冀 |
| 地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 处理 方法 装置 存储 介质 | ||
1.一种语音处理方法,应用于语音处理系统,其特征在于,包括:
获取第一语音数据,所述第一语音数据包括目标语音数据和背景噪声数据;
在所述第一语音数据中确定只包含背景噪声的噪声音频片段,并从所述第一语音数据中去除所述噪声音频片段,生成第二语音数据;以及
对所述第二语音数据进行用于抑制背景噪声数据的噪声抑制处理,生成第三语音数据。
2.根据权利要求1所述的方法,其特征在于,在所述第一语音数据中确定只包含背景噪声的噪声音频片段,包括:
将所述第一语音数据按照预设时间周期分割成多个音频片段;以及
根据预设语音参数的阈值,在多个所述音频片段中确定所述噪声音频片段。
3.根据权利要求2所述的方法,其特征在于,所述预设语音参数包括平均能量、预设频率能量和频谱平坦度,其中预设频率能量为当所述第一语音数据的频率小于预设值时对应的能量。
4.根据权利要求2和3中所述的方法,其特征在于,根据预设语音参数的阈值,在多个所述音频片段中确定所述噪声音频片段,包括:
分别获取每个所述音频片段中的平均能量、预设频率能量和频谱平坦度;
将所述音频片段中的所述平均能量小于第一阈值、所述预设频率能量小于第二阈值且所述频谱平坦度大于第三阈值对应的所述音频片段确定为噪声音频片段。
5.根据权利要求1所述的方法,其特征在于,对所述第二语音数据进行用于抑制背景噪声数据的噪声抑制处理,包括:
将所述第二语音数据的特征值调整至预设范围内,使得能够相对于所述背景噪声数据识别所述目标语音数据。
6.根据权利要求5所述的方法,其特征在于,将所述第二语音数据的特征值调整至预设范围内,包括:
根据预设语音识别数据库将所述第二语音数据的时域幅度增益第一比例阈值,得到增益后的所述第二语音数据;
根据所述预设语音识别数据库向所述增益后的第二语音数据叠加预设白噪声数据。
7.根据权利要求1所述的方法,其特征在于,所述语音处理系统包括双麦克风耳麦,包括:
通过所述双麦克风耳麦对所述第一语音数据进行降噪处理。
8.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行权利要求1至8中任意一项所述的方法。
9.一种语音处理装置,应用于语音处理系统,其特征在于,包括:
数据获取模块,用于获取第一语音数据,所述第一语音数据包括目标语音数据和背景噪声数据;
噪声去除模块,用于在所述第一语音数据中确定只包含背景噪声的噪声音频片段,并从所述第一语音数据中去除所述噪声音频片段,生成第二语音数据;以及
噪声抑制模块,用于对所述第二语音数据进行用于抑制背景噪声数据的噪声抑制处理,生成第三语音数据。
10.一种语音处理装置,应用于语音处理系统,其特征在于,包括:
处理器;以及
存储器,与所述第一处理器连接,用于为所述第一处理器提供处理以下处理步骤的指令:
获取第一语音数据,所述第一语音数据包括目标语音数据和背景噪声数据;
在所述第一语音数据中确定只包含背景噪声的噪声音频片段,并从所述第一语音数据中去除所述噪声音频片段,生成第二语音数据;以及
对所述第二语音数据进行用于抑制背景噪声数据的噪声抑制处理,生成第三语音数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中关村科金技术有限公司,未经北京中关村科金技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910955242.9/1.html,转载请声明来源钻瓜专利网。





