[发明专利]一种基于语音特征非负矩阵分解的阿尔茨海默症初筛方法在审
| 申请号: | 201810140213.2 | 申请日: | 2018-02-11 |
| 公开(公告)号: | CN108198576A | 公开(公告)日: | 2018-06-22 |
| 发明(设计)人: | 李艳雄;张聿晗;李先苦 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G10L25/66 | 分类号: | G10L25/66;G10L25/27;G10L25/03 |
| 代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
| 地址: | 510640 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 特征矩阵 阿尔茨海默症 降维 非负矩阵 初筛 分解 支持向量机分类器 测试语音 声学特征 语音特征 语音 线性预测系数 变换处理 倒谱系数 分解算法 语音样本 共振峰 区分性 声门波 高维 基频 拼接 样本 判决 | ||
1.一种基于语音特征非负矩阵分解的阿尔茨海默症初筛方法,其特征在于,包括如下步骤:
S1、提取声学特征:对语音样本进行预处理,接着提取基频、能量、谐噪比、共振峰、声门波、线性预测系数、常Q倒谱系数等声学特征,并对各个特征取绝对值,得到相应的特征矩阵V=[基频,能量,谐噪比,共振峰,声门波,线性预测系数,常Q倒谱系数];
S2、语音特征非负矩阵分解:将语音样本的特征矩阵V作为输入,采用非负矩阵分解算法对特征矩阵V进行降维分解,得到降维后的基矩阵W和系数矩阵H,使得V=W×H;
S3、训练支持向量机分类器:将训练语音样本的基矩阵W作为输入,采用径向基函数作为核函数,分别训练代表正常人语音和阿尔茨海默症患者语音的支持向量机分类器;
S4、阿尔茨海默症判决:将步骤S1和步骤S2提取的测试语音样本的基矩阵W输入训练好的支持向量机分类器,判断输入语音是正常人语音还是阿尔茨海默症患者语音,得到阿尔茨海默症初筛结果。
2.根据权利要求1所述的一种基于语音特征非负矩阵分解的阿尔茨海默症初筛方法,其特征在于,所述的步骤S1中提取声学特征包括以下步骤:
S1.1、预加重:利用数字滤波器对输入语音进行滤波,该滤波器的传递函数为:
H(z)=1-kz-1,
其中k的取值为0.96;
S1.2、分帧:将预加重后的语音数据按帧长L切分成帧,帧移为S;
S1.3、加窗:汉明窗作为窗函数,并与各帧语音相乘实现加窗处理,加窗后的第t帧语音表示为y′t(n),其中窗函数ω(n):
S1.4、利用自相关法提取各语音帧的基频F0,过程如下:
S1.4.1、对语音帧y′t(n)进行中心削波,得到yt(n):
其中CL为中心削波系数,取值为语音帧最大幅度的0.67倍;
S1.4.2、计算yt(n)的自相关函数:
其中N是每帧语音的采样点数;
S1.4.3、检测Ry(i)的峰值点,并根据峰值点集合PV计算平均基音周期:
其中I是峰值点的个数,T0是基频F0的倒数;
S1.5、计算各帧的能量,第t帧的帧能量Et为:
S1.6、提取各帧语音的谐噪比HNR;
S1.7、采用求根法计算第t帧语音共振峰频率Fi(t),假设为第一个根,3dB带宽为Bi(t),通过i次迭代得到:
其中,Ts为采样周期;
S1.8、采用逆滤波法计算声门波,设声道模型为全极点模型:
其中βk是系数,M为极点个数,唇辐射模型采用一阶微分器:
L(z)=1-μz-1,
其中μ取0.98,则第t帧语音的声门波:
其中Yt(z)为加窗后每个语音帧y′t(n)的Z变换;
S1.9、提取线性预测系数,过程如下:
S1.9.1、计算中心削波后的第t帧语音yt(n)的自相关函数Ry(j):
线性预测器用下式表示:
其中,p为线性预测系数的阶数,ai为线性预测系数;
S1.9.2、采用Levinson-Dubin法求解上述线性方程组:
当i=0时,有
在第i次递归运算时,有
递归求解上述公式,可解得p阶线性预测系数
S1.10、提取常Q倒谱系数CQCC;
S1.11、对每个语音帧重复步骤S1.4到S1.10,将依次得到的语音帧的声学特征取绝对值,并按帧的顺序拼接成为特征矩阵V。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810140213.2/1.html,转载请声明来源钻瓜专利网。





