[发明专利]一种用于鉴别诊断慢性支气管炎的高斯模糊聚类计算方法在审
申请号: | 201710595946.0 | 申请日: | 2017-07-20 |
公开(公告)号: | CN107545133A | 公开(公告)日: | 2018-01-05 |
发明(设计)人: | 陆维嘉 | 申请(专利权)人: | 陆维嘉 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 226001 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 鉴别 诊断 慢性 支气管炎 模糊 计算方法 | ||
1.一种用于鉴别诊断慢性支气管炎的高斯模糊聚类计算方法,其特征在于如下步骤:
步骤(1),筛选与慢性支气管炎诊断相关的检验指标,并在电子病历数据库中提取一定数量诊断为慢性支气管炎的患者化验指标的数值,步骤(1)具体包括以下步骤
步骤(51),首先提取一定数量诊断为慢性支气管炎患者所做的所有检验指标项目及具体的数值,使用统计软件统计阳性率较高的检验指标作为数据样本的特征;
步骤(52),以筛选出的样本特征作为提取特征,具体特征为血糖,肾功能,肝功能,癌胚抗原,高敏C反应蛋白,红细胞沉降率等;从电子病历数据库中提取诊断为慢性支气管炎的上述特征的数据样本;
步骤(53),为了消除样本特征量纲不同对分类结果的影响,首先对样本数据使用标准差规格化对数据进行标准化,x是标准化前的样本,x’是标准化后的数据;
步骤(2),估算提取样本数据的最大聚类数,步骤(2)具体包括
步骤(54),基于假设“最佳聚类数C小于总样本数n的平方根”,使用matlab自带的层次聚类函数将样本分为k类其中k满足5Cmax>k>2Cmax;
步骤(55),以第一次层次聚类运算结果中最小样本数为筛选标准,过滤掉样本数小于等于最小聚类样本数的聚类;
步骤(56),再使用matlab自带的层次聚类函数将过滤后样本分为Cmax类,Cmax即为初始聚类中心大小,所得到的聚类结果就是初始聚类中心;
步骤(3),优化模糊加权参数m,其中μD(m)=min{μG(m),μC(m)},并且
步骤(4),使用某映射将样本数据映射到希尔伯特空间,在希尔伯特空间进行聚类运算,步骤(4)具体包括
步骤(57),以C作为初始聚类中心数,从初始聚类中心中选择C个样本数最大聚类的中心作为初始聚类中心记为V0;
步骤(58),根据聚类中心Vi计算隶属度函数其中||φ(xk)-φ(vi)||2=K(xk,xk)+K(vi,vi)-2K(xk,vi),K(x,y)表示核函数,我们使用高斯核函数作为我们的映射函数,即K(x,y)=exp(-(2σ)-2||x-y||2);
步骤(59),根据计算出的隶属度矩阵计算新的聚类中心Vi+1,m表示模糊加权参数,是一个需要优化的参数,由步骤(3)优化计算可得;
步骤(60),判断新计算的聚类中心Vi+1与原聚类中心Vi的差值是否小于阈值,即判断||Vi+1-Vi||<ε,或迭代是否超过最大迭代数,l≤lmax,如果是,则循环结果;
步骤(61),保存循环结束时的隶属度矩阵U和聚类中心V,并计算粒度有效性函数其中α和1-α是权重因子。α通常比1-α稍大,一般选择α=0.6,1-α=0.4;
步骤(5),在Cmax的限制下,选取所有可能的聚类数及相应聚类中心,选择粒度有效性最小的值对应的聚类结果作为最终聚类结果;具体步骤包括
步骤(62),重复步骤(57)-(61),得到多组聚类中心,计算对应的粒度有效性函数值,比较所有的有效性函数值,取最小的有效性函数值对应的聚类结果作为最终聚类结果。
2.根据权利要求1所述的一种用于鉴别诊断慢性支气管炎的高斯模糊聚类计算方法,特征描述中的步骤(5)具体还包括:
合并聚类中心,即一般从大到小遍历所有可能的聚类数Cmax,步骤(4)运算完毕后新的初始聚类中心可通过合并相似的聚类中心获得,选择聚类中心最接近的两个聚类作为需要合并的聚类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陆维嘉,未经陆维嘉许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710595946.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种优质大棒材控冷装置
- 下一篇:一种用于铝丝拉丝成型装置中的涂擦油单元
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用