[发明专利]一种有监督的鼾声来源识别方法有效
申请号: | 201710240722.8 | 申请日: | 2017-04-13 |
公开(公告)号: | CN106821337B | 公开(公告)日: | 2020-01-03 |
发明(设计)人: | 贺冲;李阳;许志勇;田巳睿;赵兆 | 申请(专利权)人: | 南京理工大学 |
主分类号: | A61B5/00 | 分类号: | A61B5/00;G10L15/22;G10L15/16;G10L19/032 |
代理公司: | 32203 南京理工大学专利中心 | 代理人: | 薛云燕 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 监督 鼾声 来源 识别 方法 | ||
本发明公开了一种有监督的鼾声来源识别方法。该方法包括数据的预处理、训练和识别,具体步骤为:首先,对鼾声实测数据进行Mel频率变换,得到数据样本;其次,设置卷积神经网络的结构、卷积层输出特征图数量和卷积核大小、池化尺寸、权矢量更新学习率、批训练样本数目、训练迭代次数;再次,将训练集的鼾声时频谱图作为卷积神经网络输入,根据设置好的网络结构进行网络初始化,经过前向过程、方向误差传播、更新权值和偏置,直到达到指定的迭代次数,完成训练过程;最后,将测试集送入训练好的网络模型,得到识别结果。本发明可以有效地识别出鼾声来源,识别结果准确,性能优良。
技术领域
本发明属于非语音识别技术领域,特别是一种有监督的鼾声来源识别方法。
背景技术
阻塞性睡眠呼吸暂停/低通气综合征是一种睡眠呼吸疾病,与上气道阻塞、气道结构性狭窄以及上气道肌张力降低密切相关。在美国仅阻塞性睡眠呼吸暂停综合征就有约1500万成年患者,并且该病常见于高血压和其他心血管疾病(包括冠心病、中风和心房颤动)患者。全球范围内阻塞性睡眠呼吸暂停/低通气综合征的发病率较高,男性发病率大于女性(成年男性患病率为3%~7%,成年女性为2%~5%)。阻塞性睡眠呼吸暂停/低通气综合征常伴有打鼾、睡眠结构紊乱、频繁发生血氧饱和度下降、白天嗜睡等病征,可以是高血压、冠心病的独立危险因素。目前主要利用多导睡眠图诊断鼾症,但是其价格昂贵,并且对病人来说也是一种侵入式的不适。由于声学研究具有非接触式、非侵入式、低成本的优点,引起了越来越多的关注和研究。
早期的声学研究包括连续声压级测量和时频域波形的观察。最近,出现了在机器学习方法上的探索。针对鼾声检测,Tan L N等人提出了一种相关滤波器多层感知神经网络,采用频域上的相关滤波器充当第一层隐层,其他隐层则是常规的多层感知机,相较于常规的多层神经网络在测试集82%的平均检测率,该方法取得了96%的平均检测率。但是,多层神经网络结构复杂,需要训练的参数过多,学习特征效率较低。
发明内容
本发明的目的在于提供一种训练参数少、学习特征效率高的有监督的鼾声来源识别方法。
实现本发明目的的技术解决方案为:一种有监督的鼾声来源识别方法,步骤如下:
步骤1、利用麦克风阵列鼾声采集系统获取实测数据,并对实测数据进行鼾声片段的标记;
步骤2、对步骤1中得到的实测数据进行特征提取,得到基于Mel频率变换的时频谱图;
步骤3、将步骤2中提取的特征作为卷积神经网络的输入,进行训练和识别。
本发明与现有技术相比,其显著优点为:(1)仅依赖于输入数据样本和误差反向传播算法,使得前几层网络调整为适用于识别的网络模型;(2)局部感知和权值共享、卷积层与池化层交替出现,使得其具有更少的权值参数;(3)识别结果准确,性能优良。
下面结合附图对本发明作进一步详细描述。
附图说明
图1是Mel频率计算总体流程图。
图2是实测数据的时域、频域图,其中(a)为实测数据的时域图,(b)为实测数据的频域图。
图3是鼾声数据的样本示意图。
图4是面向鼾声识别的卷积神经网络训练整体流程图。
图5是卷积神经网络的结构框图。
图6是二维卷积操作示意图。
图7是池化示意图。
具体实施方式
本发明提供一种以Mel频率为特征,基于卷积神经网络的鼾声来源识别方法,其主要内容包括:
(一)将基于Mel频率变换的时频谱图输入到卷积神经网络,进行训练;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710240722.8/2.html,转载请声明来源钻瓜专利网。