[发明专利]基于高斯核函数模糊非相关判别转换的乳腺癌判别方法无效
申请号: | 201210465559.2 | 申请日: | 2012-11-16 |
公开(公告)号: | CN102999593A | 公开(公告)日: | 2013-03-27 |
发明(设计)人: | 武小红;孙俊;傅海军;陆继远 | 申请(专利权)人: | 江苏大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/16 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 卢亚丽 |
地址: | 212013 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 高斯核 函数 模糊 相关 判别 转换 乳腺癌 方法 | ||
技术领域
本发明涉及模式识别和人工智能技术领域,具体涉及一种基于高斯核函数模糊非相关判别转换的乳腺癌判别方法。
背景技术
乳腺癌是女性排名第一的常见恶性肿瘤。据统计全球每年平均约有130万人新患乳腺癌,女性乳腺癌患者占女性新发恶性肿瘤的30%,排名女性恶性肿瘤发病率第一位。乳腺癌同样是我国女性最常见的恶性肿瘤。乳腺癌可以通过临床病史,体格检查,乳房X线照相术,超声造影检查出来。但是,权威性诊断乳腺肿块必须采用细针抽吸活检,中心活检或者切除手术。其中,细针抽吸活检方法是最容易也是最快获取乳腺活组织的方法,对女性液性囊肿检查很有效。目前国内外先后运用线性规划,线性判别分析(LDA),神经网络,支持向量机来区分乳腺癌诊断数据集(WDBC)的良性和恶性乳房肿块。但是线性规划,线性判别分析(LDA)的分类准确率低;神经网络计算复杂,参数设置困难且易陷入局部极小点;支持向量机参数估计难度大,计算复杂。
自从Zadeh教授提出模糊集以来,模糊模式识别技术已被广泛用于许多领域。模糊模式识别包括无监督模糊学习和有监督模糊学习。模糊聚类是著名的无监督模糊学习方法,如模糊C-均值聚类(FCM),可能性c-均值聚类(PCM)和广义噪声聚类(GNC)等。模糊有监督学习方法有:模糊k近邻(FKNN),模糊判别分析(FDA),模糊Fisher分类器,模糊支持向量机(FSVM)等。模糊模型通常表现出比传统模型更好的性能。例如,FCM是一个众所周知的模糊聚类模型,它比硬c-均值聚类(HCM)更好。FSVM比SVM更适合减少噪声和野值.模糊Fisher分类器在处理由于照明条件不好导致的模糊脸部图像时效果更好。同时,利用改进的模糊隶属度函数,将使得训练集中的不同样本对散射矩阵重新定义所做贡献不同。
模糊非相关判别转换方法(武小红,武斌,周建江:《模糊非相关判别转换及其应用》,中国图象图形学报,2009,14(9):1832-1836.)建立在模糊类间散射矩阵,模糊总体散射矩阵和模糊类内散射矩阵基础上,其特征向量满足广义瑞利商方程,同时也满足样本到模糊非相关优化判别向量上的投影是非相关的。模糊非相关判别转换方法在处理带有模糊性的线性特征提取方面要优于非相关判别转换方法。但是,模糊非相关判别转换方法在处理线性不可分问题方面存在难度,处理效果往往不理想。因此如何扩展模糊非相关判别转换方法的功能,使之能够处理线性不可分问题是个亟待解决的问题。
发明内容
针对上述现有的良性和恶性乳房肿块判别方法的缺陷和不足,本发明的目的是提出一种基于高斯核函数的模糊非相关判别转换的乳腺癌判别方法,该方法将高斯核函数引入到模糊非相关判别转换方法,构造基于高斯核函数的模糊非相关判别转换,提取乳腺癌诊断数据集的非线性特征以处理线性不可分问题,利用非线性映射将乳腺癌诊断数据集数据映射到高维特征空间,用高斯核函数隐式实现在高维特征空间的计算,从而可以避免“维数灾难”的问题,能提取乳腺癌诊断数据集样本数据的非线性鉴别信息,分类准确率高。提高了分类准确率,达到快速,准确地判别良性还是恶性乳房肿块。
该方法具体为:
首先,将从乳腺癌诊断数据集利用模糊K-近邻法得到模糊隶属度值,由模糊C-均值聚类方法得到每类的类中心值,从而实现数据的模糊化处理;接着计算核模糊线性判别分析的最大特征值对应的特征向量并将该特征向量作为本发明方法最优鉴别向量集的第1个特征向量;然后根据乳腺癌诊断数据集到模糊非相关优化鉴别向量上的投影非相关性原则计算本发明方法的一组最优鉴别向量集,利用核函数实现模糊非相关判别转换的非线性转换。最后将乳腺癌诊断数据集进行非线性转换而实现乳腺癌的正确判别。
为实现本发明的目的,采用的技术方案具体包括以下步骤:
步骤一、将乳腺癌诊断数据集模糊化处理;
步骤二、最优鉴别向量集的第1个特征向量的计算;
步骤三、一组最优鉴别向量集的计算;
步骤四、利用核函数实现乳腺癌诊断数据集的非线性转换。
步骤五、实现良性乳房肿块数据和恶性乳房肿块数据的分类。
所述步骤一中对乳腺癌诊断数据集的模糊化处理方法如下:
1.用K-近邻法获得样本xk(xk属于第j类)的K个近邻样本,则xk的模糊隶属度值则按如下规律计算:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210465559.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:红外激光对射光墙式入侵探测器
- 下一篇:一种氩气的净化提纯设备