[发明专利]一种用于疾病程度分类的数据决策方法及其系统有效
申请号: | 202010010514.0 | 申请日: | 2020-01-06 |
公开(公告)号: | CN111430024B | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 吴嘉;余庚花;谭延林;常柳 | 申请(专利权)人: | 中南大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G06F18/23;G06F18/22;G06F18/24 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 曾志鹏 |
地址: | 410012 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 疾病 程度 分类 数据 决策 方法 及其 系统 | ||
1.一种用于疾病程度分类的数据决策方法,其特征在于,包括以下步骤:
对疾病的特征指标进行聚类分析,将所述特征指标划分为关联度高的特征Ihigh和关联度低的特征Ilow;
将所述关联度高的特征Ihigh和CT图像输入编码器进行训练得到训练后的自编码器;
将训练好的自编码器与softmax分类器结合得到决策分类器,将所述关联度高的特征Ihigh和CT图像输入所述决策分类器得到决策输出;
对特征指标进行聚类分析前需对提取特征指标的CT图像进行筛选:删去不包含病变区域的图像,保留存在病变区域的图像;
对特征指标进行聚类分析包括以下步骤:
数据预处理,筛选出存在病变区域的CT图像,根据筛选后的CT图像筛选出乳腺癌诊断相关的肿瘤标志物和病理特征中量化的指标;
把同期病人数据分成一类,把病人在筛选出的D个指标作为参考值,并结合波动程度、标准范围以及所述参考值构建目标函数;
根据所述目标函数进行迭代计算得到关联度高的特征Ihigh和关联度低的特征Ilow;
目标函数的模型为:
其中,C为模糊组个数,D为指标的个数,τc为组c的聚类中心,为控制参数,σ为指标d的关键值Impd的聚类中心,λ为拉格朗日乘子,dcd为组c的聚类中心τc与第d个指标关键值之间的距离。
2.根据权利要求1所述的一种用于疾病程度分类的数据决策方法,其特征在于,所述波动程度的计算模型为:
假设第期患者的第d个指标值的波动程度为则:
其中,为第期患者第d个指标的波动情况,为第期患者第d个指标的均值,Ird表示第r个患者的d个指标数值,Rκ为数据中期患者总数,指标的值在第期患者中普遍波动范围大的值,即值较大,则该指标d在期患者中没有代表性。
3.根据权利要求1所述的一种用于疾病程度分类的数据决策方法,其特征在于,将所述关联度高的特征Ihigh和CT图像输入编码器前对输入数据进行加噪处理。
4.根据权利要求3所述的一种用于疾病程度分类的数据决策方法,其特征在于,所述加噪处理为通过编码器为输入数据加上标记信息:
对于只含有一层隐藏层的编码器,第一层隐藏层的输出为:
其中,w1为第一层隐藏层单元对应的权重向量,v1表示第一层隐藏层单元所对应的辅助决策信息对应的权重向量,表示所述输入数据经过加噪后的数据,I表示筛选出的标记参数集,标记参数作为辅助决策信息,b1为偏差向量,
加噪后的数据为:
xou=g(w2h1+b2)
Iou=g(v2h1+b′2)
对隐藏层层数为L层的编码器,则对于第l层隐藏层,由于第一层隐藏层输入为加噪后的数据为:
xou=g(wLhL-1+bL)
Iou=g(vLhL-1+b′L)
假设L层的编码器,前层为编码层,后为解码层,将图像信息作为编码器的输入,输出为输入数据经过编码和解码的重构版本xou,并通过最小化损失来训练模型,即最小化输入x和它的重构版本xou的差值。
5.根据权利要求3所述的一种用于疾病程度分类的数据决策方法,其特征在于,损失函数的模型为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010010514.0/1.html,转载请声明来源钻瓜专利网。