[发明专利]一种采用机器学习算法对乳腺癌进行良恶性特征统计的方法有效
申请号: | 201910379311.6 | 申请日: | 2019-05-08 |
公开(公告)号: | CN110136108B | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 翟运开;赵杰;陈昊天;甘富文;石金铭;陈保站;卢耀恩;曹明波 | 申请(专利权)人: | 郑州大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/11;G16H30/20;G06V10/764 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 滕诣迪 |
地址: | 450000 河南省郑*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种采用机器学习算法对乳腺癌进行良恶性特征统计的方法,属于大数据技术领域,建立影像数据库服务器、医生客户端服务器、第一辅助服务器和第二辅助服务器,解决了全面的提取重要的影响特征,进行特征去冗余,提高结果准确度的技术问题,本发明辅助系统的分类结果比较准确,可以作为医生诊断的重要参考信息,同时本发明可以循环迭代更新,随着数据量的增多,准确率会越来越高。 | ||
搜索关键词: | 一种 采用 机器 学习 算法 乳腺癌 进行 恶性 特征 统计 方法 | ||
【主权项】:
1.一种采用机器学习算法对乳腺癌进行良恶性特征统计的方法,其特征在于:包括如下步骤:步骤1:建立影像数据库服务器、医生客户端服务器、第一辅助服务器和第二辅助服务器,影像数据库服务器、医生客户端服务器、第一辅助服务器和第二辅助服务器之间均通过互联网通信;影像数据库服务器用于存储所有病人的乳腺MRI图像;步骤2:医生通过医生客户端服务器读取影像数据库服务器中的病人的乳腺MRI图像;医生在医生客户端服务器上对病人的乳腺MRI图像进行肿瘤区域分割,医生客户端服务器将分割后的病人的乳腺MRI图像保存为分割文件,并将分割文件传送给数据库服务器进行存储;数据库服务器将分割文件和病人的乳腺MRI图像归类存储在同一个文件夹中,生成病人数据包;步骤3:重复执行步骤2,直到影像数据库服务器中存储的所有病人的乳腺MRI图像均生成分割文件,并生成病人数据包为止;步骤4:第二辅助服务器调取影像数据库服务器中所有的病人数据包作为训练数据,并进行特征提取、特征选择和分类器训练,进而得到分类器模型,其具体步骤如下:步骤A1:每一个病人数据包中包含的乳腺MRI图像均拥有2个序列,分别为T2W序列和T1C序列,T2W序列和T1C序列均包括数张图片;步骤A2:特征提取包括使用Pyradiomics2.1.2工具中的python包对分割文件进行肿瘤最大层面的2D特征提取,2D特征包括一阶统计特征、2D形状特征、灰度共生矩阵特征和灰度游程长度矩阵纹理特征;同时对一阶统计特征和灰度游程长度矩阵纹理特征进行小波变换;步骤A3:特征选择包括对所述2D特征进行Box‑Cox变换,使得偏态分布更接近于正态分布;对所述2D特征进行全局归一化z‑score标准化,生成数据集,经过处理后的2D特征值均值为0,标准差为1;采用Scikitlearn工具中的分层抽样的方法对数据集进行划分,分成训练样本和测试样本,训练集样本为N例,测试集样本为M例,N取值为正整数,M取值为正整数,指定一个用于保证试验的可重复性的随机数种子,随机数种子的选取只是为了保证每次分层抽样的结果不变,随机数种子的取值数由用户自由选取;对训练样本和测试样本的2D特征值进行曼‑惠特尼U检验,选取p值小于0.10的特征;在单参数情况下,使用曼‑惠特尼U检验单独评估每个2D特征值的预测值,在youden系数最大化时记录每个2D特征值的AUC值;使用最大相关最小冗余的特征选择算法进行2D特征值的筛选,即,采用Survcomo程序包,将每个2D特征值得出的mRMR值按照由大到小的顺序进行排序;选取mRMR排名前30的2D特征值,通过基于AIC的后退法减少2D特征值,知道最后剩余20个2D特征值;步骤A4:分类器训练包括分别对T1C序列、T2W序列和T1C序列+T2W序列进行训练,使用SVM分类器进行模型训练:采用支持向量机训练分类模型,得出最优模型,分类决策函数为以下公式:
其中,k(x,y)=h(x)·h(y)为核函数,用于将样本数据映射到线性可分离的高维空间;通过选择合适的核函数k(x,y)和惩罚系数,构造并找到最优解ai*,其中bi*的值通过任意一个支持向量求得;用四种核函数进行训练,这四种核函数包括线性核函数Linear、多项式核函数Poly、径向基核函数RBF和Sigmoid核函数Sigmoid,训练模型在验证数据集上进行验证,最后选出效果最好的SVM模型,作为最优模型;步骤5:第二辅助服务器将最优模型传送给影像数据库服务器进行存储器;步骤6:医生通过医生客户端服务器将就诊病人的MRI图像输入到影像数据库服务器;影像数据库服务器根据步骤2的方法生成病人数据包;第一辅助服务器从影像数据库服务器中调取病人数据包,第一辅助服务器根据步骤A1到步骤A3的方法对病人数据包进行特征提取、特征选择和分类器训练,并调取第二辅助服务器所得出的最优模型,进行肿瘤良恶性的数据统计,生成特征数据统计表;步骤7:第一辅助服务器将特征数据统计表发送给医生客户端服务器并展示给医生进行参考。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学,未经郑州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910379311.6/,转载请声明来源钻瓜专利网。