[发明专利]一种基于音频特征信号的分类方法有效
| 申请号: | 201810994308.0 | 申请日: | 2018-08-29 |
| 公开(公告)号: | CN109166591B | 公开(公告)日: | 2022-07-19 |
| 发明(设计)人: | 龙华;杨明亮;邵玉斌;杜庆治 | 申请(专利权)人: | 昆明理工大学 |
| 主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/00;G10L15/22;G10L15/18;G10L15/08 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 650093 云*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 音频 特征 信号 分类 方法 | ||
1.一种基于音频特征信号的分类方法,其特征在于:具体步骤如下:
(1)音频信号采集:采集音频信号,获得音频样本;
(2)音频信号预处理:将所采集的音频样本中的模拟信号转换为数字信号,将数字信号写入WAV文件中,对写入WAV文件中的数字信号进行滤波、预加重、分帧处理;
(3)特征参数提取:对预处理后的音频信号进行高维特征参量的提取,包括线性预测系数、线性预测倒谱系数和梅尔频率倒谱系数;
(4)特征参量降维:将上述提取出的高维特征参量送入搭建好的降维模型中进行降维处理并保存;
(5)分类模型的搭建:首先用服从高斯分布的隐函数f描述一个类同另外一个类的相似性,其次用压缩函数将f的输出值压缩到[0 1]范围,根据压缩值大小进行类别区分,所搭建的模型即为所需的分类模型;
所述分类模型的搭建包括以下步骤:
(1)将降维处理后的两类音频特征信号分别定义为y=1与y=0两种类别,x定义为经过降维处理之后的音频特征信号,分类模型中引入一个隐函数f(x)和响应函数δ(f(x)),其中隐函数f(x)服从高斯分布,响应函数将f(x)的结果压缩到[0 1]区间内,数据的似然函数为π(x)=p(y=1|x)=σ(f(x)),p(y=-1|f)=1-δ(f),这里的响应函数为:
假定其隐函数为高斯平方指数核函数,其表达式为:
其中σf2为平方指数核的系数参数,l表示x与x′两点之间距离影响参数,其核函数两个超参量为θ(σf,l),对于给定一个测试点和x*条件下隐函数的联合分布为:
其中K为协方差矩阵,其表达式为:
K*=[k(x*,x1) k(x*,x2)...k(x*,xn)] K**=k(x*,x*)
其隐函数的条件分布为:
f*|f~N(K*K-1f,K**-K*K-1K*T)
隐函数的预测条件概率:
隐函数预测条件概率输出均值定义为协方差矩阵为诶定义为K′,将隐函数的输出值通过压缩函数将其压缩到[01]区间得到分类成员的概率,并且定义δ*=δ(f*)=φ(f*)即有:
δ*=∫δ(f*)p(f*|f)df*
其压缩处理值
(2)对于上述似然进行函数解析,根据贝叶斯公式,隐函数的后验分布为
利用单纯形优化算法可得到:
将其带入隐函数的预测条件概率计算公式进行迭代求解出f的最优解此处用高斯分布q(f|x,y)来逼近后验分布p(f|x,y),在后验分布最大处对logp(f|x,y)做二阶泰勒展开,即得到高斯分布
从而求得
K′=K+W-1,
其中W为负logp(y|f)的海森矩阵,将上式带入对数似然函数,运用单纯性法寻优算法求解出最优超参量;
(3)本发明假设的隐函数为平方指数核函数,分类模型输出结果的条件概率为:
p(y|x,θ)=∫p(y|f)p(f|x)df
对logp(y|x,θ)在局部最大值点做二阶泰勒展开并进行概率归一化处理,最后进行拉普拉斯近似展开
将前述求解出的超参量回代得到所求的分类模型;
(6)音频特征参量分类:将步骤(4)中降维后的音频信号的高维特征参量送入步骤(5)所述的分类模型中进行分类,并将其分类结果进行可视化展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810994308.0/1.html,转载请声明来源钻瓜专利网。





