[发明专利]一种基于隐半马尔可夫模型的噪声鲁棒的语音检测方法有效
申请号: | 201010117537.8 | 申请日: | 2010-03-03 |
公开(公告)号: | CN101807397A | 公开(公告)日: | 2010-08-18 |
发明(设计)人: | 刘祥龙;梁苑;单宝松;楼奕华;李未 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G10L15/14 | 分类号: | G10L15/14 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 李新华 |
地址: | 100190*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于隐半马尔可夫模型的噪声鲁棒的语音检测方法:(1)建立隐半马尔可夫模型λ=(A,B,π,τ);(2)隐半马尔可夫模型λ中π,τ的参数初始化;(3)对非空输入信号进行DCT变换;(4)利用前若干帧输入信号及似然比分别估计B的参数和似然比检验阈值,进行似然比检验,完成语音检测;(5)动态调整B的参数及似然比检验阈值。本发明根据语音及噪音的时延特征,动态调整模型参数及检验阈值,利用似然比检验进行语音检测,实现了噪声鲁棒的实时语音检测。 | ||
搜索关键词: | 一种 基于 隐半马尔可夫 模型 噪声 语音 检测 方法 | ||
【主权项】:
1.基于隐半马尔可夫模型的噪声鲁棒的语音检测方法,其特征在于步骤如下:(1)建立包含语音及非语音两个状态Q={q0,q1}的隐半马尔可夫模型λ=(A,B,π,τ),其中:q0为非语音,q1为语音;A={aij},i,j=0,1为状态qi,qj转移概率;B={bi(Ot)},i=0,1;t>0为输入信号DCT变换系数Ot={o1,o2,...,oK},K>0在给定状态qi下条件分布概率bi(Ot)=P(Ot|qi),其中o1,o2,...,oK相互独立;π={πi},i=0,1;πi>0为状态qi先验分布概率;τ={P(d|qi)},i=0,1;d>0为状态qi持续d的概率;(2)依据训练数据集统计结果初始化对隐半马尔可夫模型中状态的先验分布概率π={πi}、状态持续时间分布Weibull的参数(ki,ωi),信号帧序号t=0;(3)若输入语音S信号为空,结束;否则,对S进行DCT变换
t=t+1;(4)若t<P,判定当前信号为噪声VAD=0,转(3);若t=P,估计给定状态下输入信号DCT变换系数Ot分布的Gauss参数(μiG,σi)和Laplace参数(μiL,li),计算前P帧的似然比LRTt,初始化似然比检验阈值η,判定当前信号为噪声VAD=0,转(3);若t>P,计算似然比LRTt,若LRTt≥η则判定当前信号为语音VAD=1,若LRTt<η则判定当前信号为噪声VAD=0,转(5);(5)调整给定状态下DCT变换系数Ot分布的Gauss参数(μiG,σi)及Laplace参数(μiL,li),更新似然比检验阈值η;转(3)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010117537.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种串联排列的电磁-弹性箔片混合轴承
- 下一篇:利培酮化合物的持续递送制剂