[发明专利]鲁棒性活动语音检测方法无效
申请号: | 201110281881.5 | 申请日: | 2011-09-21 |
公开(公告)号: | CN102332264A | 公开(公告)日: | 2012-01-25 |
发明(设计)人: | 韩纪庆;游大涛 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G10L15/20 | 分类号: | G10L15/20 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 张果瑞 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
鲁棒性活动语音检测方法,属于音频信号处理领域。本发明为了解决现有的活动语音检测方法是基于傅立叶变换提取的频域音频特征,但该类型音频特征对噪音缺乏鲁棒性的问题。本发明方法包括:一:采样大量的历史语音数据,训练出语音字典集;二:根据所述语音字典集对输入的语音信号进行稀疏分解,提取语音的稀疏系数C;三:根据所述稀疏系数C重构被稀疏分解的语音信号 |
||
搜索关键词: | 鲁棒性 活动 语音 检测 方法 | ||
【主权项】:
1.鲁棒性活动语音检测方法,其特征在于,该方法包括以下步骤:步骤一:采样大量的历史语音数据,并根据所述历史语音数据训练出一个语音字典集Ψ∈RL×D,其中R表示是实数空间,L和D是大于0的自然数,分别表示某一空间维度;步骤二:根据步骤一获取的语音字典集Ψ,对输入的语音信号S={s1,s2,...,sN}∈RL×N进行稀疏分解,提取语音的稀疏系数C={c1,c2,...,cN}∈RD×N;其中N是自然数,表示某一空间维度;步骤三:根据步骤二获取的稀疏系数C重构被稀疏分解的语音信号S ~ = { s ~ 1 , s ~ 2 , . . . , s ~ N } ∈ R L × N ; ]]> 步骤四:获取步骤三所述重构的语音信号
的时域能量序列E={e1,e2,...,eN}∈R;步骤五:设计一个短时窗W1,以所述短时窗W1与时域能量序列E进行滑动卷积运算,将每次计算的结果STMEn作为某一特定帧sn的得分yn;其中n=1,...,N,W1的长度取值范围为[2+1,2×10+1];步骤六:设计一个长时窗W2,以所述长时窗W2与时域能量序列E进行滑动卷积运算,将每次计算的结果LTMEn作为某一特定帧sn的判决阈值βn;其中W2的长度取值范围为[1000,1000×10],当n<6000,取n作为长度值;步骤七:判断是否有yn>βn公式成立,判断结果为是,则确定输入的语音信号S为语音,判断结果为否,则确定输入的语音信号S为非语音,进而完成对活动语音的检测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110281881.5/,转载请声明来源钻瓜专利网。