[发明专利]基于语音特征与机器学习的抑郁症自动评估系统和方法有效

专利信息
申请号: 201611147549.9 申请日: 2016-12-13
公开(公告)号: CN106725532B 公开(公告)日: 2018-04-24
发明(设计)人: 胡斌;刘振宇;康环宇 申请(专利权)人: 兰州大学
主分类号: A61B5/16 分类号: A61B5/16
代理公司: 北京汇彩知识产权代理有限公司11563 代理人: 王键
地址: 730000 *** 国省代码: 甘肃;62
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 语音 特征 机器 学习 抑郁症 自动 评估 系统 方法
【权利要求书】:

1.一种基于语音特征与机器学习的抑郁症自动评估系统,其特征在于,包括

(a)语音采集录音模块,用于对被试者施以不同的情绪语料刺激的同时,记录被试者的语音信息;所述语音采集分为“语音问答”、“文本朗读”、“图片描述”三个模块,分别包含正向、中性、负向三种情绪的问题、文本和图片;

(b)语音特征计算模块,用于对采集的语音信号进行预处理后,计算语音的声学特征;所述语音特征计算模块包含预处理模块,所述预处理模块包括依次连接的预加重、降噪、滤波模块,对采集的语音信号依次进行预加重、降噪和滤波处理;所述预加重模块采用k值为0.97的预加重滤波器,所述滤波模块采用通带频率为60~4500Hz的滤波器;所述语音的声学特征包括局部特征与统计学特征,计算局部特征时,将语音切分为帧,对单个语音帧进行计算;统计学特征是在多个语音帧之间进行计算;

(c)语音数据库模块,包含用于语音特征有效性分析、分类器训练优化、系统分类率的相关数据;所述语音数据库模块运行在本系统的计算机上,用Microsoft SQL Server实现;包含的数据为:语音文件的语音特征、人工诊断标签、分类器分类标签,该数据库只保存经过医生诊断的被试数据;

(d)机器学习模块,用语音数据库的数据进行语音特征与抑郁症的相关性分析,以确定有效特征的提取方式,并训练用于自动评估的分类器;所述机器学习模块包括分类器,使用的分类器模型为支持向量机;支持向量机使用LIB支持向量机来实现,选取的核函数为Radial Basis Function;

所述确定的有效特征提取方式是指:第一步,先采用最小冗余最大相关的方式,去掉明显不相关的特征,从语音数据库中保存的语音特征中初步筛选出一个特征子集,作为待选特征集;第二步,在待选特征集中,排除一个特征后,用特征子集去训练分类器,计算出该特征子集的分类率,若分类率明显降低,则说明该特征有效,应作为有效特征;若分类率不改变或升高,说明该特征为无效特征;多次重复第二步操作,对待选特征集进行至少一次的遍历之后,保留下来的特征,即构成有效特征集;

(e)自动评估模块,提取被试者有效语音特征并进行抑郁程度分类,实现依据输入的语音样本自动评估被试者的抑郁程度;具体包括:第一步,将没有人工诊断结果的被试语音样本,按照机器学习模块确定的有效特征提取方式,计算出有效特征;第二步,将有效特征输入由机器学习模块训练好的分类器,由分类器进行抑郁程度的分类;

所述基于语音特征与机器学习的抑郁症自动评估系统的工作步骤为:

1)语音信息采集录音获取语音样本:通过对被试者施以不同的情绪语料刺激的同时,使用录音设备记录被试者的语音信息;

2)语音特征计算获取语音特征集:语音样本通过预处理后,计算语音的声学特征;将经过医生诊断的语音声学特征,包含诊断结果一起存入语音数据库;没有经过医生诊断的被试语音样本则进入步骤4);

3)依据存入语音数据库的语音声学特征进行机器学习,确定语音有效特征提取方式,训练用于自动评估的分类器;

4)提取有效特征并进行分类得出评估结论:提取出被试语音样本在评估抑郁症过程中最有效的语音特征,即有效特征;并通过训练好的分类器对提取的有效特征进行分类,实现依据输入的语音样本自动评估被试者的抑郁程度;

其中,所述步骤1)中,包括以下步骤:首先测量现场噪音,排除噪声源,在噪声符合要求之后,开始语音采集;语音采集过程中分别施以不同的情绪语料刺激,包括“语音问答”、“文本朗读”、“图片描述”三个不同的实验情境;

所述步骤2)中,包括语音声学特征计算的步骤:第一步,将语音切分为帧,在单个语音帧中计算出局部声学特征;第二步,在多个语音帧之间,计算出统计学特征;第三步,若是已经过医生诊断的被试,将该被试的所有语音特征和人工诊断结果存入语音数据库;所述的特征提取算法包括但不限于:共振峰计算、有声段检测、MFCC、TEO、HNR、SNR、PPQ、APQ;

所述步骤3)中,包括特征有效性分析与分类器训练的步骤:第一步,使用语音样本库中的已有人工诊断结论的数据,先采用最小冗余最大相关的方式,去掉明显不相关的特征,从语音声学特征计算出的特征集中初步筛选出一个特征的子集,作为待选特征集;第二步,在待选特征集中,排除一个特征后,用剩余特征训练分类器,若分类率明显降低,则说明该特征有效,并重复第二步;多次循环,对待选特征集进行至少一次的遍历之后,保留下来的特征,即构成有效特征集;有效特征集包含的特征即为有效特征;通过所述步骤最终训练出的分类器,即为用于自动评估时使用的分类器;

所述步骤4)中,包括自动诊断的步骤:第一步,将没有人工诊断结果的被试语音样本,按照步骤3)确定的有效特征提取方式,计算出有效特征;第二步,将有效特征输入由步骤3)训练好的分类器,由分类器进行抑郁程度的分类;所述分类是指以两种标签:正常、抑郁进行分类。

2.根据权利要求1所述的系统,其特征在于,所述语音采集录音模块包括采集设备、录音设备,采集设备有电脑控制端、噪声计、监听耳机、音箱、麦克风、声卡、防喷罩、话筒支架;所述监听耳机、音箱、麦克风、声卡均连接至电脑;录音设备采用NEUMANN TLM102麦克 风和采样率为44.1kHz、数据长度为24位的RME FIREFACE UCX声卡;采集的录音数据以.WAV格式保存。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于兰州大学,未经兰州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611147549.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top