[发明专利]基于支撑向量机的基带时域音频信号分类方法有效
| 申请号: | 201210125085.7 | 申请日: | 2012-04-25 |
| 公开(公告)号: | CN102760444A | 公开(公告)日: | 2012-10-31 |
| 发明(设计)人: | 刘一民;李元新;孟华东 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L19/00;G10L11/00;G10L15/06 |
| 代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 贾玉健 |
| 地址: | 100084 北京市海淀区1*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 支撑 向量 基带 时域 音频 信号 分类 方法 | ||
1.基于支撑向量机的基带时域音频信号分类方法,其特征在于,包括如下步骤:
步骤一:将总长度为N的基带时域音频信号序列s={s(1),s(2),...,s(N)}分为K段,每段长度为L,得到初始分段子序列
步骤二:对每个零均值分段子序列进行加窗处理,得到结果为
步骤三:对加窗处理后的结果分别进行傅里叶变换处理,得到每个加窗后的零均值分段子序列的频谱幅度序列为
步骤四:分别求出每个频谱幅度的标准差d={d(1),d(2),...,d(K)},其中然后求出所有标准差的平均值,得到该基带时域音频信号序列的一个特征量,即频谱幅度标准差
步骤五:将各个零均值分段子序列x1,x2,...,xK按照次序依次组合成为一个长序列x,即x={x1,x2,...,xK}={x(1),x(2),...,x(N)},然后计算出该序列的归一化自相关矩阵,结果为其中Q是自相关矩阵的维数,取值范围为[50,90];
步骤六:对自相关矩阵R进行奇异值分解,得到R=VΛVH,其中
Λ=diag(λ1,λ2,…,λQ)Q×Q=diag(γ1+σ2,…,γp+σ2,σ2,…,σ2)Q×Q,且γ1≥γ2≥…≥γp,从而得到子空间的分界点p;
步骤七:根据计算出该基带时域音频信号序列的另一个特征量,记为信噪比参量
步骤八:将该基带时域音频信号序列的两个特征量,即频谱幅度标准差D和信噪比参量构成输入向量,送入已经训练过的SVM分类器中,从而鉴别出该基带时域音频信号的种类,区分出语音信号和噪声信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210125085.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轴承的热处理方法
- 下一篇:跨骑型电动车辆的车辆接近告知装置





