[发明专利]一种基于多粒度证据邻域粗糙集的乳腺癌数据分类方法有效
| 申请号: | 202011023382.1 | 申请日: | 2020-09-25 | 
| 公开(公告)号: | CN112163133B | 公开(公告)日: | 2021-10-08 | 
| 发明(设计)人: | 鞠恒荣;李铭;丁卫平;曹金鑫;黄嘉爽;周子洵;张毅 | 申请(专利权)人: | 南通大学 | 
| 主分类号: | G06F16/906 | 分类号: | G06F16/906;G06K9/62 | 
| 代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 | 
| 地址: | 226019*** | 国省代码: | 江苏;32 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 粒度 证据 邻域 粗糙 乳腺癌 数据 分类 方法 | ||
本发明提供了一种基于多粒度证据邻域粗糙集的乳腺癌数据分类方法,包括如下步骤:S10采集乳腺癌数据集,并将所述乳腺癌数据集分为训练数据集和测试数据集;S20在所述训练数据集上构建多粒度数据;S30在不同粒度的所述病理特征约简集合下预测所述测试数据的类别标签集合;S40根据投票机制得到所述测试数据集中票数最多的类别标签,获得乳腺癌数据分类结果。本发明的一种基于多粒度证据邻域粗糙集的乳腺癌数据分类方法,去除了冗余属性压缩乳腺癌数据规模,同时在分类过程中,将证据理论引入邻域粗糙分类,充分地利用了样本之间的紧密性,提升了对乳腺癌数据分类的效率和精度,对乳腺癌智能辅助分类具有较强的应用价值。
技术领域
本发明涉及智慧医疗技术领域,具体涉及一种基于多粒度证据邻域粗糙集的乳腺癌数据分类方法。
背景技术
乳腺癌(breast cancer)是乳腺上皮细胞在多种致癌因子的作用下,发生增殖失控的现象。疾病早期常表现为乳房肿块、乳头溢液、腋窝淋巴结肿大等症状,晚期可因癌细胞发生远处转移,出现多器官病变,直接威胁患者的生命。近年来,我国乳腺癌的发病率呈逐年上升趋势,每年有30余万女性被诊断出乳腺癌。由于癌细胞的无限制的增殖能力,乳腺癌越早发现越好,早期的乳腺癌治愈几率也较大。判断乳腺癌病变状况的有效办法是通过乳腺癌细胞的病理特征实验,然而实验却需要几十种细胞的病理特征实验结合在一起。这会导致实验测试数据属性过多和数据量大,也会增加医生对乳腺癌患者的病变情况的判断方面的工作量。如何有效分析患者的乳腺癌病变信息和帮助医生有效地分析患者乳腺癌病变的症状,亟需一种新的方法能有效地减少乳腺癌数据分类信息中冗余的属性,降低乳腺癌数据的检测时间和提高检测效率,有效进行乳腺癌数据分类的筛查和分析。
发明内容
为了解决上述问题,本发明提供一种基于多粒度证据邻域粗糙集的乳腺癌数据分类方法,去除冗余属性压缩乳腺癌数据规模,同时在分类过程中,将证据理论引入邻域粗糙分类,充分地利用了样本之间的紧密性,提升了对乳腺癌数据分类的效率和精度,对乳腺癌智能辅助分类具有较强的应用价值。
为了实现以上目的,本发明采取的一种技术方案是:
一种基于多粒度证据邻域粗糙集的乳腺癌数据分类方法,包括如下步骤: S10采集乳腺癌数据集,并将所述乳腺癌数据集按照8:2的比例划分为训练数据集和测试数据集,同时将所述乳腺癌数据集转换为一个四元组决策信息系统;S20在所述训练数据集上构建多粒度数据,在不同粒度上通过邻域决策错误率的病理特征约简算法得到病理特征约简集合;S30在不同粒度的所述病理特征约简集合下通过证据理论驱动的邻域粗糙分类器预测所述测试数据的类别标签集合;S40根据投票机制得到所述测试数据集中票数最多的类别标签,获得乳腺癌数据分类结果。
进一步地,所述决策信息系统S=U,C∪D,V,f,其中,U={x1,x2,...,xN}表示乳腺癌数据集中的乳腺癌患者对象集合,N表示乳腺癌患者的个数;C={a1,a2,...,an} 表示乳腺癌患者细胞病理特征的非空有限集合,n表示乳腺癌患者细胞病理特征的个数;D={d1,d2,...,dm}表示乳腺癌患者决策属性的非空有限集合,m表示乳腺癌患者病决策属性的个数,且V=∪a∈C∪DVa,Va是乳腺癌患者细胞病理特征a的可能情况;f:U×C∪D→V是一个信息函数,它为每个乳腺癌患者细胞病理特征a赋予一个信息值,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011023382.1/2.html,转载请声明来源钻瓜专利网。





