[发明专利]基于语音特征与机器学习的抑郁症自动评估系统和方法有效
申请号: | 201611147549.9 | 申请日: | 2016-12-13 |
公开(公告)号: | CN106725532B | 公开(公告)日: | 2018-04-24 |
发明(设计)人: | 胡斌;刘振宇;康环宇 | 申请(专利权)人: | 兰州大学 |
主分类号: | A61B5/16 | 分类号: | A61B5/16 |
代理公司: | 北京汇彩知识产权代理有限公司11563 | 代理人: | 王键 |
地址: | 730000 *** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语音 特征 机器 学习 抑郁症 自动 评估 系统 方法 | ||
技术领域
本发明涉及计算机辅助医疗诊断技术领域,特别是涉及一种基于语音特征与机器学习的抑郁症自动评估系统和方法。
背景技术
抑郁症是一种普遍的心理疾病,影响着全世界约3.5亿人,世界卫生组织(World Health Organization,WHO)预测到2020年抑郁症将成为全球第二大主要病因,因此找到一种有效的评估抑郁症的方法很有必要。目前,抑郁症的诊断和疗效评估缺少客观的测量方法和工具,主要依靠家属供史、患者自述以及临床量表等主观评估方法,从而造成早期情感障碍识别困难,患者常常因此失去最佳治疗时机。
随着语音信号分析与处理技术的发展,尤其是线性预测技术在语音处理中的应用,基音频率、共振峰、线性预测系数、线性预测倒谱系数、Mel频率倒谱系数等语音特征参数被证实与情感(尤其是抑郁症状)密切相关,因此,可以通过对用户语音信号特征的分析,为抑郁症的临床诊断提供一种基于被试实际表现的客观参考。
发明内容
本发明提供一种基于语音特征与机器学习的抑郁症自动评估系统和方法,基于语音处理、特征提取、机器学习技术,通过寻找语音特征与抑郁症之间的联系,从而实现以非侵入式的方式客观评估被试是否抑郁的目的。
本发明的技术方案是:
1.一种基于语音特征与机器学习的抑郁症自动评估系统,其特征在于,包括(a)语音采集录音模块,用于对被试者施以不同的情绪语料刺激的同时,记录被试者的语音信息;(b)语音特征计算模块,用于对采集的语音信号进行预处理后,计算语音的声学特征;(c)语音数据库模块,包含用于语音特征有效性分析、分类器训练优化、系统分类率的相关数据;(d)机器学习模块,用语音数据库的数据进行语音特征与抑郁症的相关性分析,以确定有效特征的提取方式,并训练用于自动评估的分类器;(e)自动评估模块,提取被试者有效语音特征并进行抑郁程度分类,实现依据输入的语音样本自动评估被试者的抑郁程度。
2.所述语音采集录音模块包括录音设备,采集设备有电脑控制端、噪声计、监听耳机、音箱、麦克风、声卡、防喷罩、话筒支架;所述监听耳机、音箱、麦克风、声卡均连接至电脑;录音设备采用NEUMANN TLM102麦克风和采样率为44.1kHz、数据长度为24位的RME FIREFACE UCX声卡;采集的录音数据以.WAV格式保存。
3.所述语音特征计算模块包含预处理模块,所述预处理模块包括依次连接的预加重、降噪、滤波模块,对采集的语音信号依次进行预加重、降噪和滤波处理;所述预加重模块采用k值为0.97的预加重滤波器,所述滤波模块采用通带频率为60~4500Hz的滤波器。
4.所述机器学习模块包括分类器,使用的分类器模型为支持向量机(Support Vector Machine,SVM);SVM使用LIBSVM来实现,选取的核函数为RBF(Radial Basis Function)。
5.所述语音数据库模块运行在本系统的计算机上,用Microsoft SQL Server实现;包含的数据为:语音文件的语音特征、人工诊断标签、分类器分类标签,该数据库只保存经过医生诊断的被试数据。
6.一种基于语音特征与机器学习的抑郁症自动评估方法,其特征在于,包括以下步骤:
1)语音信息采集录音获取语音样本:通过对被试者施以不同的情绪语料刺激的同时,使用录音设备记录被试者的语音信息;
2)语音特征计算获取语音特征集:语音样本通过预处理后,计算语音的声学特征;将经过医生诊断的语音声学特征,包含诊断结果一起存入语音数据库;没有经过医生诊断的被试语音样本则进入步骤4);
3)依据存入语音数据库的语音声学特征进行机器学习,确定语音有效特征提取方式,训练用于自动评估的分类器;
4)提取有效特征并进行分类得出评估结论:提取出被试语音样本在评估抑郁症过程中最有效的语音特征,即有效特征;并通过训练好的分类器对提取的有效特征进行分类,实现依据输入的语音样本自动评估被试者的抑郁程度。
7.所述步骤1)中,包括以下步骤:首先测量现场噪音,排除噪声源,在噪声符合要求之后,开始语音采集;语音采集过程中分别施以不同的情绪语料刺激,包括“语音问答”、“文本朗读”、“图片描述”三个不同的实验情境。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于兰州大学,未经兰州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611147549.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于视线的儿童专注力测试分析系统和方法
- 下一篇:胰腺假性囊肿双套引流管