[发明专利]Sphinx语速识别中背景降噪的优化方法在审

申请号：	201710350222.X	申请日：	2017-05-18
公开（公告）号：	CN107123419A	公开（公告）日：	2017-09-01
发明（设计）人：	沈卫忠;陈靖	申请（专利权）人：	北京大生在线科技有限公司
主分类号：	G10L15/20	分类号：	G10L15/20;G10L15/02;G10L21/0208;G10L21/0232;G10L21/0316
代理公司：	北京双收知识产权代理有限公司11241	代理人：	陈泉
地址：	100085 北京***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种Sphinx语速识别中背景降噪的优化方法，音频输出装置连续不断的向sphinx输入PCM数据，sphinx通过背景噪声取样来提取背景噪声，计算出背景噪声频谱，用包含噪声语音的频谱减去噪音频谱后得到降噪后语音的频谱，利用后继音频中的静音，重复噪声频谱提取算法，利用修正后的噪声频谱对包含噪声语音的频谱进行降噪。本发明Sphinx语速识别中背景降噪的优化方法，对使用的噪声频谱做及时修正，修正噪声频谱的方法是使用后继音频中的静音，重复噪声频谱提取算法，得到新的噪声频谱，并将之用于修正降噪所用的噪声频谱，可以从返回指定时间解析出的音素个数来实现语速识别的业务，提高降噪效果。
搜索关键词：	sphinx 语速识别背景优化方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种Sphinx语速识别中背景降噪的优化方法，音频输出装置连续不断的向sphinx输入PCM数据，sphinx通过背景噪声取样来提取背景噪声，计算出背景噪声频谱，用包含噪声语音的频谱减去噪音频谱后得到降噪后语音的频谱，其特征在于，利用后继音频中的静音，重复噪声频谱提取算法，得到修正后的噪声频谱，利用修正后的噪声频谱对包含噪声语音的频谱进行降噪。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京大生在线科技有限公司，未经北京大生在线科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710350222.X/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]Sphinx语速识别中背景降噪的优化方法在审

专利文献下载