[发明专利]一种用于语音测谎系统中的稀疏谱特征提取方法在审
申请号: | 201710502053.7 | 申请日: | 2017-06-27 |
公开(公告)号: | CN107293302A | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 赵鹤鸣;樊晓鹤;陈雪勤 | 申请(专利权)人: | 苏州大学 |
主分类号: | G10L17/26 | 分类号: | G10L17/26;G10L25/18;G10L25/24 |
代理公司: | 苏州翔远专利代理事务所(普通合伙)32251 | 代理人: | 陆金星 |
地址: | 215000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 语音 系统 中的 稀疏 特征 提取 方法 | ||
1.一种用于语音测谎系统中的稀疏谱特征提取方法,其特征在于,包括如下步骤:
步骤一、提取语音信号的梅尔频率谱系数、小波包频带倒谱系数,并融合所述梅尔频率谱系数和小波包频带倒谱系数构成倒谱特征;
步骤二、采用K-奇异值分解算法对倒谱特征进行训练得到混合过完备表示字典;
步骤三、在步骤二中所得到的混合过完备表示字典上,采用正交匹配追踪算法对倒谱特征进行稀疏编码,获取稀疏谱特征。
2.根据权利要求1所述的用于语音测谎系统中的稀疏谱特征提取方法,其特征在于:所述步骤一中的小波包频带倒谱系数的提取步骤包括:
(1)对原始的真话和谎话语料进行分段、分帧加汉明窗预处理获取有效语音帧x(n);
(2)对有效语音帧x(n)进行6层小波包分解,对分解后的节点重新按升序排列,获取相应子频带的小波包系数dm[n](m=1,…,M);
(3)计算各个子节点的能量:
其中,M为分解后每层中子节点的数目总和;
(4)对M个节点的对数能量进行离散余弦变换:
由上式求得24阶小波包频带倒谱系数。
3.根据权利要求1所述的用于语音测谎系统中的稀疏谱特征提取方法,其特征在于:所述步骤二中的混合过完备表示字典获取的具体步骤包括:
(1)定义一个给定的初始字典A:
由上式求解原始特征参数S∈Rn×K的稀疏表示结果,得到系数矩阵X;
(2)根据系数矩阵X中的非零值对A中的原子逐个更新。在每次迭代过程中仅计算一个原子ɑj及其在矩阵X中对应的向量,约束函数为:
其中,矩阵Ek为S中N帧参数在拿掉第k列之后进行稀疏表示的总体误差,ɑj表示A中的第j个原子,表示系数矩阵X中与ɑj对应的向量,
定义wk为所用到原子的下标集合:
定义Ωk为(wk(i),i)处的值是1,其他处是0的矩阵,则误差矩阵为:
(3)对误差矩阵进行奇异值分解:
用矩阵U的首列替换迭代计算前的原子ɑj,V(:,1)∆(1,1)替换迭代前的系数向量,
将从真话和谎话语料中提取的倒谱特征矩阵ST和SF,分别通过上述算法进行字典学习,得到表征真话和谎话的子字典AT和AF,对这两个子字典进行融合:
得到表征真话和谎话两类参数特性的混合过完备字典A。
4.根据权利要求1所述的用于语音测谎系统中的稀疏谱特征提取方法,其特征在于:所述步骤三中的稀疏谱特征获取的具体步骤包括:
(1)给定字典矩阵A,参数向量s,配置稀疏度参数L,令残差r0=s,索引集Λ0=Ø,t =1;
(2)求出使得r和字典A中原子ɑj之内积最大时的下标λ:
;
(3)更新索引集,收集寻找到的字典A中的重构原子集;
(4)根据最小二乘法计算:
;
(5)对残差进行更新:
直到满足要求t >L,则不再进行迭代计算,得到每帧语料的参数矩阵ST和SF在混合字典A下的稀疏特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710502053.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于牙齿咬合声音的识别方法及系统
- 下一篇:一种多声道语音丢包补偿方法