[发明专利]一种基于深度PCA变换的早期糖尿病风险预测方法有效

专利信息
申请号: 202011624374.2 申请日: 2020-12-31
公开(公告)号: CN112635064B 公开(公告)日: 2022-08-09
发明(设计)人: 潘晓光;田奇;李娟;宋晓晨;韩丹 申请(专利权)人: 山西三友和智慧信息技术股份有限公司
主分类号: G16H50/30 分类号: G16H50/30;G16H50/70;G06K9/62
代理公司: 太原荣信德知识产权代理事务所(特殊普通合伙) 14119 代理人: 杨凯;连慧敏
地址: 030000 山西省*** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 pca 变换 早期 糖尿病 风险 预测 方法
【权利要求书】:

1.一种基于深度PCA变换的早期糖尿病风险预测方法,其特征在于:包括下列步骤:

S100、输入早期糖尿病数据集;

S200、数据预处理,计算皮尔森相关系数,滤除冗余特征,得到输入数据;

S300、通过深度PCA提取输入数据的特征集合,作为训练逻辑回归分类器的输入;所述S300中提取输入数据的特征集合的方法为:首先取前两维主成分作为初始变换的特征,用F1表示进行第一次PCA变换之后获得的两维特征向量,即F1大小为m*2的矩阵,以F1为基底,对其进行扩张,具体方式为以该特征以矩阵乘法的方式乘以该特征的转置,用特征矩阵M1表示,即M1=F1%*%t(F1),其中%*%表示矩阵乘法,t()表示取输入向量的转置,M1为m*m的矩阵,得到M1之后,对M1继续进行PCA变换,获得F2,以上述方式同样进行扩张和变换,直到进行PCA变换得到Fq+1,若Fq+1提供的方差占据原始数据的95%以上,就停止变换,并以F1,F2,…,Fq+1为特征集合,构建逻辑回归分类器;

S400、基于特征集合训练逻辑回归分类器,用于待评估病例样本的判断;

S500、输入新的病例样本信息,输出该样本是否患糖尿病的结果判定及相应的置信度。

2.根据权利要求1所述的一种基于深度PCA变换的早期糖尿病风险预测方法,其特征在于:所述S100中的早期糖尿病数据集包含与糖尿病在早期阶段相关的生理学和病理学指标,以行表示样本个体,以列表示特征变量,并标注是否罹患糖尿病,作为输入。

3.根据权利要求1所述的一种基于深度PCA变换的早期糖尿病风险预测方法,其特征在于:所述S200中数据预处理的方法为:首先计算各个特征变量之间的相关性,滤除相关性高的冗余特征,相关性的计算取皮尔森相关系数来衡量各特征之间的关系,以0.9为阈值。

4.根据权利要求1所述的一种基于深度PCA变换的早期糖尿病风险预测方法,其特征在于:所述S400中训练逻辑回归分类器的方法为:逻辑回归分类器通过最大化似然函数来求取各个特征向量之间的权重关系,并建立线性回归模型输出对于待测样本的打分值score,结合Sigmoid函数输出分类结果,当score不小于0.5时,输出score的值作为结果的置信度,而当score的结果小于0.5时,输出1-score作为结果的置信度评估。

5.根据权利要求1所述的一种基于深度PCA变换的早期糖尿病风险预测方法,其特征在于:所述S500中基于构建的逻辑回归分类器,输入待评估的病例样本,得到最终样本判定结果,并输出结果的置信度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西三友和智慧信息技术股份有限公司,未经山西三友和智慧信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011624374.2/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top