[发明专利]一种用于语音测谎系统中的稀疏谱特征提取方法在审
申请号: | 201710502053.7 | 申请日: | 2017-06-27 |
公开(公告)号: | CN107293302A | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 赵鹤鸣;樊晓鹤;陈雪勤 | 申请(专利权)人: | 苏州大学 |
主分类号: | G10L17/26 | 分类号: | G10L17/26;G10L25/18;G10L25/24 |
代理公司: | 苏州翔远专利代理事务所(普通合伙)32251 | 代理人: | 陆金星 |
地址: | 215000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 语音 系统 中的 稀疏 特征 提取 方法 | ||
技术领域
本发明属于语音信号处理和模式识别领域,具体涉及一种用于语音测谎系统中的稀疏谱特征提取方法。
背景技术
谎言检测技术在犯罪侦查、军事情报和公共场所安全检查等方面有着重要的应用,具有广阔的发展前景,并将逐渐成为公安、司法、人事及金融行业必备的技术检测手段。当人在具有较强动机(比如获取金钱利益、逃避罪责等)的前提下,进行欺骗他人或者故意制造虚假事实等说谎行为时,其交感神经系统或者副交感神经系统的活动会增强,以及在心理层面上会产生紧张情绪,进而使得说谎者的心率、血压、呼吸和肌肉收缩活动发生变化。测谎技术的主要依据是声音、肢体语言、面部表情、心理反应和生理指标的变化,而语音信号中包含着人类丰富的情感信息,并且受多方面因素的广泛影响,在说谎状态下,由于神经系统的控制和紧张情绪的影响,声带披裂肌群的紧缩、松弛活动与非说谎状态相比更加剧烈,导致语音参数发生变化。相比测谎所用的血压、心跳和脑电等生理信号而言,语音信号更加便于采集和分析,因而基于语音分析的测谎研究具有重要价值。
现有谎言检测研究的识别准确率普遍处于70%以下,而研究表明传统的音质和韵律方面的声学特征对于谎言检测问题的识别性能不佳。小波分析法是实现语音信号分析的一个极其重要并且已经得到广泛应用的方法,小波包变换具有较好的时频特性,通过多尺度分析法能够实现对语音频带无重叠的多层次分解,同时对语音高、低频区间逐层解析,能够实现自适应地提取表征语音特性的大量中、高频区域信息,因而适用于分析语音信号中、高频区间所包含的不可忽略的细节信息。
特征冗余也是影响模型识别准确率的一个重要因素,随着所提取特征种类和维数的增加,数据集内存在冗余信息,在进行高维特征的模型训练和识别时,就会引起样本数量与样本维度不均衡以及计算复杂度增大的问题,导致样本集内数据的类间差异性不易被鉴别和区分。传统的数据降维方法如主成分分析法(Principal Component Analysis,PCA)、线性鉴别分析法(Linear Discriminant Analysis,LDA)等,并不能较好的处理非线性数据集,且只能用来处理一类特征,不能够有效去除那些冗余且差异性不显著的特征向量。
发明内容
本发明的发明目的是提供一种用于语音测谎系统中的稀疏谱特征提取方法,一方面可以弥补传统梅尔频率谱系数提供中高频段信息存在的不足,另一方面可以解决非线性融合参数集的冗余问题,降低分类模型的计算复杂度。
为达到上述发明目的,本发明采用的技术方案是:一种用于语音测谎系统中的稀疏谱特征提取方法,包括如下步骤:
步骤一、提取语音信号的梅尔频率谱系数、小波包频带倒谱系数,并融合所述梅尔频率谱系数和小波包频带倒谱系数构成倒谱特征;
步骤二、采用K-奇异值分解算法对倒谱特征进行训练得到混合过完备表示字典;
步骤三、在步骤二中所得到的混合过完备表示字典上,采用正交匹配追踪算法对倒谱特征进行稀疏编码,获取稀疏谱特征。
进一步地,所述步骤一中的小波包频带倒谱系数的提取步骤包括:
(1)对原始的真话和谎话语料进行分段、分帧加汉明窗预处理获取有效语音帧x(n);
(2)对有效语音帧x(n)进行6层小波包分解,对分解后的节点重新按升序排列,获取相应子频带的小波包系数dm[n](m=1,…,M);
(3)计算各个子节点的能量:
其中,M为分解后每层中子节点的数目总和;
(4)对M个节点的对数能量进行离散余弦变换:
由上式求得24阶小波包频带倒谱系数。
进一步地,所述步骤二中的混合过完备表示字典获取的具体步骤包括:
(1)定义一个给定的初始字典A:
由上式求解原始特征参数S∈Rn×K的稀疏表示结果,得到系数矩阵X;
(2)根据系数矩阵X中的非零值对A中的原子逐个更新。在每次迭代过程中仅计算一个原子ɑj及其在矩阵X中对应的向量约束函数为:
其中,矩阵Ek为S中N帧参数在拿掉第k列之后进行稀疏表示的总体误差,ɑj表示A中的第j个原子,表示系数矩阵X中与ɑj对应的向量,
定义wk为所用到原子的下标集合:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710502053.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于牙齿咬合声音的识别方法及系统
- 下一篇:一种多声道语音丢包补偿方法