[发明专利]语音驱动的帕金森病多症状特征参数的小样本学习方法在审
申请号: | 202210280063.1 | 申请日: | 2022-03-22 |
公开(公告)号: | CN114373484A | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 季薇;符宇辰;李云 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G10L25/66 | 分类号: | G10L25/66;G10L25/30;G06N3/04;G06N3/08;A61B5/00;A61B5/11 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 张玉红 |
地址: | 210046 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 驱动 帕金森病 症状 特征 参数 样本 学习方法 | ||
1.一种语音驱动的帕金森病多症状特征参数的小样本学习方法,多症状为吞咽困难症状、冻结步态症状、震颤症状、异动症状和开关期症状,其特征在于:所述小样本学习方法包括如下步骤:
步骤1:采集帕金森病患者参与多语音任务的语音数据,并对所述语音数据进行多标签标注;
步骤2:对步骤1中采集的帕金森患者的语音数据进行预处理,然后提取梅尔频率特征,得到能够表征语音数据的特征向量,并构造多任务数据集;
步骤3:语音数据的梅尔频率特征向量输入卷积神经网络得到每一种标签的正类高层表征向量和负类高层表征向量;
步骤4:由步骤3的高层表征向量计算得到每一个标签的原型向量,并计算支持集原型和查询集原型之间的距离,将距离通过softmax后得到样本具有每一种标签的概率;
步骤5:定义损失函数并训练模型;
步骤6:得到训练好的模型,输入新的语音样本,输出预测的5种标签值,辅助医生做出吞咽困难症状、冻结步态症状、震颤症状、异动症状和开关期症状下的评估。
2.根据权利要求1所述语音驱动的帕金森病多症状特征参数的小样本学习方法,其特征在于:所述步骤2具体包括如下步骤:
步骤2-1:将步骤1中采集的帕金森患者的语音转换为频谱图后通过梅尔滤波器组得到语音的梅尔频谱特征;
步骤2-2:对于数据集中的个样本语音的梅尔频谱特征,根据语音来源的患者症状定义标签信息,组成样本对,其中代表第个样本,为第个样本的标签,是一个长度为5的one-hot向量,向量中的0代表受试者没有该标签所代表的症状,反之为1;
步骤2-3:将整个数据集划分为多个任务集合,在每个任务集合中,对于标签,从中无放回采样个正样本,其中,即每一个样本的标签都等于1,构成标签k的正支撑集,再采样个负样本,即每一个样本的标签都等于0,构成标签k的负支撑集;
步骤2-4:然后再从数据集中随机采样1个样本作为查询样本,每个任务集合需包含所有的5个标签的正负支撑集,即,因此每个任务集合中包含条数据。
3.根据权利要求1所述语音驱动的帕金森病多症状特征参数的小样本学习方法,其特征在于:步骤3具体为将语音数据的梅尔频谱特征向量输入Resnet34卷积神经网络以获得语音数据的高层表征,具体包括如下步骤:
步骤3-1:初始化Resnet34卷积神经网络参数:采用在AudioSet音频数据集上预训练好的模型参数作为初始化参数;
步骤3-2:设Resnet34为函数,将每一个任务集中的正支撑集当中的样本输入网络得到标签k下的正特征集,即;
步骤3-3:负支撑集输入网络得到标签k下的负特征集,即;
步骤3-4:查询样本xi输入网络得到查询特征。
4.根据权利要求1所述语音驱动的帕金森病多症状特征参数的小样本学习方法,其特征在于:所述步骤4具体包括如下步骤:
步骤4-1:将正特征集中所有的C个向量相加求平均得到正原型向量,即:
同样地,可以得到负原型向量;
步骤4-2:分别计算标签k下查询样本的特征与和的欧氏距离:
;
步骤4-3:通过softmax函数计算查询样本是每一种标签, k=(1,2,3,4,5)正样本的概率:
。
5.根据权利要求1所述语音驱动的帕金森病多症状特征参数的小样本学习方法,其特征在于:所述步骤5定义损失函数并训练模型具体包括如下步骤:
步骤5-1:采用交叉熵损失函数计算模型预测结果和查询样本之间的损失值:
其中T为数据集中包含的任务集合数量,为符号函数,代表观测样本是否具有标签的真实值,代表观测样本属于类别k的预测概率;
步骤5-2:训练模型时,batch size为可以调整的超参数,设batch size为,即代表一个batch中包含B个任务集合;
步骤5-3:利用Adam优化器进行随机梯度下降,每训练一个batch更新一次模型参数,基于训练数据迭代更新Resnet34卷积神经网络的参数。
6.根据权利要求1-5任一项所述语音驱动的帕金森病多症状特征参数的小样本学习方法,其特征在于:该方法通过语音分析系统实现,所述语音分析系统包括:
语音信号采集模块:用于采集帕金森病患者的语音数据,以及帕金森病患者吞咽困难症状、冻结步态症状、震颤症状、异动症状和开关期症状的特征信息;
语音信号预处理模块:对语音数据进行预处理,然后提起梅尔频谱特征,并将数据集划分为多个任务集合;
语音特征提取模块:利用Resnet34卷积神经网络提取语音的高层表征向量,并计算原型向量;
距离度量模块:计算原型样本和查询样本之间的欧氏距离,并通过softmax函数计算查询样本的标签概率;
原型网络模型训练模块:采用交叉熵损失函数和Adam优化器训练原型网络模型;
语音分析模块:将待测语音输入训练好的模型,得到待测者吞咽困难症状、冻结步态症状、震颤症状、异动症状和开关期症状的关键特征指标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210280063.1/1.html,转载请声明来源钻瓜专利网。