[发明专利]基于支撑向量机的基带时域音频信号分类方法有效

申请号：	201210125085.7	申请日：	2012-04-25
公开（公告）号：	CN102760444A	公开（公告）日：	2012-10-31
发明（设计）人：	刘一民;李元新;孟华东	申请（专利权）人：	清华大学
主分类号：	G10L21/02	分类号：	G10L21/02;G10L19/00;G10L11/00;G10L15/06
代理公司：	西安智大知识产权代理事务所 61215	代理人：	贾玉健
地址：	100084 北京市海淀区1***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于支撑向量基带时域音频信号分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于支撑向量机的基带时域音频信号分类方法，其特征在于，包括如下步骤：

步骤一：将总长度为N的基带时域音频信号序列s＝{s(1)，s(2)，...，s(N)}分为K段，每段长度为L，得到初始分段子序列s1={s1(1),s1(2),...,s1(L)}s2={s2(1),s2(2),...,s2(L)}...sK={sK(1),sK(2),...,sK(L)},]]>其中s_i(m)＝s((i-1)L+m)(i＝1，2，...，K，m＝1，2，...，L)，然后每个初始分段子序列分别减去各自的均值，可得零均值分段子序列x1={x1(1),x1(2),...,x1(L)}x2={x2(1),x2(2),...,x2(L)}...xK={xK(1),xK(2),...,xK(L)},]]>其中

xi(m)=si(m)-1LΣj=1Lsi(j);]]>

步骤二：对每个零均值分段子序列进行加窗处理，得到结果为x1′=x1wTx2′=x2wT...xK′=xKwT,]]>其中w为汉宁窗；

步骤三：对加窗处理后的结果分别进行傅里叶变换处理，得到每个加窗后的零均值分段子序列的频谱幅度序列为f1=|FFT(x1′)|={f1(1),f1(2),...,f1(M)}f2=|FFT(x2′)|={f2(1),f2(2),...,f2(M)}...fK=|FFT(xK′)|={fK(1),fK(2),...,fK(M)},]]>其中M是频谱幅度序列的长度；

步骤四：分别求出每个频谱幅度的标准差d＝{d(1)，d(2)，...，d(K)}，其中然后求出所有标准差的平均值，得到该基带时域音频信号序列的一个特征量，即频谱幅度标准差

步骤五：将各个零均值分段子序列x₁，x₂，...，x_K按照次序依次组合成为一个长序列x，即x＝{x₁，x₂，...，x_K}＝{x(1)，x(2)，...，x(N)}，然后计算出该序列的归一化自相关矩阵，结果为其中Q是自相关矩阵的维数，取值范围为[50，90]；

步骤六：对自相关矩阵R进行奇异值分解，得到R＝VΛV^H，其中

Λ＝diag(λ₁，λ₂，…，λ_Q)_Q×Q＝diag(γ₁+σ²，…，γ_p+σ²，σ²，…，σ²)_Q×Q，且γ₁≥γ₂≥…≥γ_p，从而得到子空间的分界点p；

步骤七：根据计算出该基带时域音频信号序列的另一个特征量，记为信噪比参量

步骤八：将该基带时域音频信号序列的两个特征量，即频谱幅度标准差D和信噪比参量构成输入向量，送入已经训练过的SVM分类器中，从而鉴别出该基带时域音频信号的种类，区分出语音信号和噪声信号。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于清华大学，未经清华大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201210125085.7/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于支撑向量机的基带时域音频信号分类方法有效

专利文献下载