[发明专利]鲁棒性活动语音检测方法无效
| 申请号: | 201110281881.5 | 申请日: | 2011-09-21 |
| 公开(公告)号: | CN102332264A | 公开(公告)日: | 2012-01-25 |
| 发明(设计)人: | 韩纪庆;游大涛 | 申请(专利权)人: | 哈尔滨工业大学 |
| 主分类号: | G10L15/20 | 分类号: | G10L15/20 |
| 代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 张果瑞 |
| 地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 鲁棒性 活动 语音 检测 方法 | ||
1.鲁棒性活动语音检测方法,其特征在于,该方法包括以下步骤:
步骤一:采样大量的历史语音数据,并根据所述历史语音数据训练出一个语音字典集Ψ∈RL×D,其中R表示是实数空间,L和D是大于0的自然数,分别表示某一空间维度;
步骤二:根据步骤一获取的语音字典集Ψ,对输入的语音信号S={s1,s2,...,sN}∈RL×N进行稀疏分解,提取语音的稀疏系数C={c1,c2,...,cN}∈RD×N;其中N是自然数,表示某一空间维度;
步骤三:根据步骤二获取的稀疏系数C重构被稀疏分解的语音信号
步骤四:获取步骤三所述重构的语音信号的时域能量序列E={e1,e2,...,eN}∈R;
步骤五:设计一个短时窗W1,以所述短时窗W1与时域能量序列E进行滑动卷积运算,将每次计算的结果STMEn作为某一特定帧sn的得分yn;其中n=1,...,N,W1的长度取值范围为[2+1,2×10+1];
步骤六:设计一个长时窗W2,以所述长时窗W2与时域能量序列E进行滑动卷积运算,将每次计算的结果LTMEn作为某一特定帧sn的判决阈值βn;其中W2的长度取值范围为[1000,1000×10],当n<6000,取n作为长度值;
步骤七:判断是否有yn>βn公式成立,判断结果为是,则确定输入的语音信号S为语音,判断结果为否,则确定输入的语音信号S为非语音,进而完成对活动语音的检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110281881.5/1.html,转载请声明来源钻瓜专利网。





