[发明专利]一种用于鉴别诊断慢性支气管炎的高斯模糊聚类计算方法在审
申请号: | 201710595946.0 | 申请日: | 2017-07-20 |
公开(公告)号: | CN107545133A | 公开(公告)日: | 2018-01-05 |
发明(设计)人: | 陆维嘉 | 申请(专利权)人: | 陆维嘉 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 226001 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 鉴别 诊断 慢性 支气管炎 模糊 计算方法 | ||
技术领域
本发明涉及一种用于鉴别诊断慢性支气管炎的高斯模糊聚类计算方法。
技术背景
慢性支气管炎被认为是气管和支气管周边组织中的非特异性炎症。临床实践表明,对慢性支气管炎的进一步细分对于该病的诊治具有非常重要的意义。根据该病的不同特点以及是否有并发症状的情况,可将慢性支气管炎进一步诊断为慢性支气管炎伴有呼吸道感染,单纯性慢性支气管炎,慢性支气管炎伴肺气肿,粘液脓性支气管炎等。临床对于慢性支气管症的进一步分类往往来源于医生的临床经验与主观判断,往往有主观性太强的缺点,因此使用某种智能算法对临床数据进行分析从而进一步判断患者所患的是何种慢性支气管炎具有非常重要的意义。传统模糊聚类算法可描述如下,假设数据集合X={x1,x2,…,xn},传统模糊聚类函数就是要最小化样本与聚类中心距离的总和,使用公式表示如下
式中,m是加权参数,Pj是K-中心聚类,μjk是隶属度,表示样本j属于聚类k的程度,0≤μjk≤1,且满足约束使用拉格朗日乘子法,可将公式(1)进一步转化为公式(2)
传统模糊聚类算法可描述如下
步骤(11),对聚类问题进行充分评估,选择合适样本特征,以这些特征从数据库中获取样本数据集,根据样本数据集的特点,去掉一些冗余特征,并对数据标准化处理;
步骤(12),人为设定初始聚类数C,并随机选择初始化聚类中心V0;
步骤(13),不断进行如下描述的循环迭代,依据公式(2)对隶属度矩阵进行更新;使用计算得到的新的隶属度矩阵对聚类中心进行更新
步骤(14),判断新旧聚类中心的变化是否小于阈值或迭代超过最大迭代数,如果是则跳出循环,此时的聚类中心和隶属度矩阵,就是最终的聚类结果。
传统模糊聚类算法的初始聚类数C是人为指定的且初始化中心的选择具有任意性,初始聚类数的正确与否以及选择的初始聚类中心对最终的聚类结果影响巨大,因此我们需要一种评价指标去判断最佳聚类数,以确保最终聚类结果的准确性。传统聚类算法对于离群点是敏感的,需要减少离群点对聚类的影响。传统聚类算法中,模糊加权参数m常常被直接赋值为2,这种定值方法没有理论验证过程,缺乏说服力。
发明内容
步骤(1),筛选与慢性支气管炎诊断相关的检验指标,并在电子病历数据库中提取一定数量诊断为慢性支气管炎的患者化验指标的数值,步骤(1)具体包括以下步骤:
步骤(51),首先提取一定数量诊断为慢性支气管炎患者所做的所有检验指标项目及具体的数值,使用统计软件统计阳性率较高的检验指标作为数据样本的特征;
步骤(52),以筛选出的样本特征作为提取特征,具体特征为氯,磷,二氧化碳结合力,葡萄糖,血清胆碱酯酶,球蛋白,中性粒细胞分类,尿酸,红细胞压积,红细胞计数,碱性磷酸酶,肌酐,平均血红蛋白浓度,前白蛋白,丙氨酸氨基转移酶;从电子病历数据库中提取诊断为慢性支气管炎的上述特征的数据样本;
步骤(53),为了消除样本特征量纲不同对分类结果的影响,首先对样本数据使用标准差规格化对数据进行标准化,x是标准化前的样本,x’是标准化后的数据;
步骤(2),估算提取样本数据的最大聚类数,步骤(2)具体包括
步骤(54),基于假设“最佳聚类数C小于总样本数n的平方根”,使用matlab自带的层次聚类函数将样本分为k类其中k满足5Cmax>k>2Cmax;
步骤(55),以第一次层次聚类运算结果中最小样本数为筛选标准,过滤掉样本数小于等于最小聚类样本数的聚类;
步骤(56),再使用matlab自带的层次聚类函数将过滤后样本分为Cmax类,Cmax即为初始聚类中心大小,所得到的聚类结果就是初始聚类中心;
步骤(3),优化模糊加权参数m,其中μD(m)=min{μG(m),μC(m)},并且
步骤(4),使用某映射将样本数据映射到希尔伯特空间,在希尔伯特空间进行聚类运算,步骤(4) 具体包括
步骤(57),以C作为初始聚类中心数,从初始聚类中心中选择C个样本数最大聚类的中心作为初始聚类中心记为V0;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陆维嘉,未经陆维嘉许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710595946.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种优质大棒材控冷装置
- 下一篇:一种用于铝丝拉丝成型装置中的涂擦油单元
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用