[发明专利]复杂背景噪声中的语音激活检测方法有效
| 申请号: | 201110093186.6 | 申请日: | 2011-04-14 |
| 公开(公告)号: | CN102194452A | 公开(公告)日: | 2011-09-21 |
| 发明(设计)人: | 梁峰;张凡;曹军勤;杨勇 | 申请(专利权)人: | 西安烽火电子科技有限责任公司 |
| 主分类号: | G10L11/02 | 分类号: | G10L11/02 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 710075 陕西*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种复杂背景噪声中的语音激活检测方法,依次包括以下步骤:1)首先对数据进行TEO运算;2)对输入数据x(n)进行预加重;3)带通滤波;4)分帧加窗处理;5)计算每帧的自相关及其标准方差的开方值;6)计算初始阶段20帧的Stati及其均值mean(Stati)和标准方差std(Stati),将std(Stati)与预置门限比较,判断有无语音;7)计算后续数据;8)计算连续FrameN帧的Stati,根据其均值mean(Stati)和标准方差std(Stati),进行二次判决;9)考虑语音间隔及持续时间Speechmin=100~200ms,Silencemin=500~1000ms,在Statusfinal=0条件下,当出现连续Ns(该值与FrameN相关)个atatus=1时,判断语音出现;在Statusfinal=1条件下,当出现连续NE(该值同样与FrameN相关)个Status=0时,判断语音结束,最终判断语音的真正端点。 | ||
| 搜索关键词: | 复杂 背景 噪声 中的 语音 激活 检测 方法 | ||
【主权项】:
1.一种复杂背景噪声中的语音激活检测方法,其特征在于,依次包括以下步骤:1)、首先对数据进行TEO运算:TEO[x(n)]=x(n)2-x(n+1)x(n-1);2)、对输入数据x(n)进行预加重,其传递函数为:H(z)=1-μz-1,μ∈[0.92,0.96],x(n)=filter([1-μ],1,x(n));3)、带通滤波:采用带通滤波,除去无用信号:x(n)=band_pass_filter(x(n))4)、分帧加窗处理:帧长20ms,帧间重叠20%~40%。窗函数一般采用Hamming窗:xn(N)=xn(N).*Hamming(N);5)、计算每帧的自相关及其标准方差的开方值:Stat=k*sqrt(std(xcorr(xn(N)))),k为系数,它与判决门限取值相关;6)、计算初始阶段20帧的Stati及其均值mean(Stati)和标准方差std(Stati),将std(Stati)与预置门限比较,判断有无语音;判断根据:如果初始阶段无语音,则std(Stati)较小,否则std(Stati)较大;如初始阶段无语音,则计算该阶段的参考门限,作为后续数据的判决门限:Thref=mean(Stat(1:20))+m*std(Stat(1:20));7)、计算后续数据,每帧判决一下:
8)、计算连续FrameN帧的Stati,根据其均值mean(Stati)和标准方差std(Stati),进行二次判决:
或者采用多数判决原则次判断:
如8帧中超过5帧出现Statustemp=1,则判断Status=1,出现语音;9)、考虑语音间隔及持续时间Speechmin=100~200ms,Silencemin=500~1000ms,在Statusfinal=0条件下,当出现连续NS(该值与FrameN相关)个Status=1时,判断语音出现;在Statusfinal=1条件下,当出现连续NE(该值同样与FrameN相关)个Status=0时,判断语音结束,最终判断语音的真正端点。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安烽火电子科技有限责任公司,未经西安烽火电子科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110093186.6/,转载请声明来源钻瓜专利网。





