[发明专利]基于卷积自编码器高斯混合模型的健康数据检测方法在审

申请号：	202011226516.X	申请日：	2020-11-04
公开（公告）号：	CN112509696A	公开（公告）日：	2021-03-16
发明（设计）人：	朱壮壮;周治平	申请（专利权）人：	江南大学
主分类号：	G16H50/30	分类号：	G16H50/30;G16H50/20;G06N3/08;G06N3/04;A61B5/00
代理公司：	哈尔滨市阳光惠远知识产权代理有限公司 23211	代理人：	林娟
地址：	214000 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于卷积编码器混合模型健康数据检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于卷积自编码器高斯混合模型的健康数据异常检测方法，其特征在于，所述方法包括：

步骤一：将采集到的原始高维健康数据在卷积自编码器上进行训练，以最小化重构误差为原则，结合BP优化算法，得到原始高维健康数据的低维特征表示；

步骤二：以原始高维健康数据的低维特征作为高斯混合模型的输入计算原始高维健康数据对应的样本密度，将得到的样本密度最大值记为密度阈值，同时结合EM算法对高斯混合模型进行训练，得到最优的高斯混合模型参数；

计算过程中，利用混合概率、均值和协方差来构造协方差矩阵的cholesky分解，得到原始高维健康数据的样本密度；

训练过程中，利用贝叶斯信息准则确定高斯混合模型组件个数，通过EM算法的不断迭代，对高斯混合模型进行训练，得到最优的高斯混合模型参数；

步骤三：在对健康数据进行检测时，采用最优高斯混合模型参数下的高斯混合模型对原始高维健康数据的低维特征表示进行密度估计，得到最优高斯混合模型的参数下各原始高维健康数据的样本密度，超过密度阈值的样本密度对应的健康数据即为异常数据。

2.根据权利要求1所述的方法，其特征在于，所述原始高维健康数据包括但不限于消耗的卡路里、步数、距离、高度、静息心率、睡眠心率、运动心率、轻运动心率、运动心率、久坐时间、有氧运动时间、有氧运动消耗卡路里、燃烧脂肪、睡眠效率、睡眠时间、入睡时间、睡眠开始时间、睡眠结束时间、深睡时间、轻度睡眠时间、REM睡眠时间和醒来次数。

3.根据权利要求2所述的方法，其特征在于，所述方法在将采集到的原始高维健康数据在卷积自编码器上进行训练之前还包括：

对原始高维健康数据进行预处理：利用多重插补的方式处理健康数据缺失值问题并采用min-max归一化处理原始高维健康数据；

根据下式对原始高维健康数据进行归一化处理：

其中x_e表示每条原始高维健康数据中任一维度数据，x_min与x_max分别表示该任一维度数据中的最小值与最大值，x_e′表示归一化处理后的数据。

4.根据权利要求3所述的方法，其特征在于，假设通过卷积自编码器获得的原始高维健康数据的低维特征表示为Z＝[z₁,z₂,...,z_d′]，其中d′表示原始高维健康数据潜在空间表示的维度；

所述计算过程中，利用混合概率、均值和协方差来构造协方差矩阵的cholesky分解，得到原始高维健康数据的样本密度E(z)：

其中，K代表高斯组件的个数；

其中，代表第k个高斯组件协方差，1≤k≤K；L是高斯组件协方差矩阵和惩罚项经过cholesky分解的下三角矩阵；v是利用混合概率、均值和协方差来构造协方差矩阵的cholesky分解时得到的线性方程组的解。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于江南大学，未经江南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011226516.X/1.html，转载请声明来源钻瓜专利网。