[发明专利]一种采用机器学习算法对乳腺癌进行良恶性特征统计的方法有效
申请号: | 201910379311.6 | 申请日: | 2019-05-08 |
公开(公告)号: | CN110136108B | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 翟运开;赵杰;陈昊天;甘富文;石金铭;陈保站;卢耀恩;曹明波 | 申请(专利权)人: | 郑州大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/11;G16H30/20;G06V10/764 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 滕诣迪 |
地址: | 450000 河南省郑*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 采用 机器 学习 算法 乳腺癌 进行 恶性 特征 统计 方法 | ||
本发明公开了一种采用机器学习算法对乳腺癌进行良恶性特征统计的方法,属于大数据技术领域,建立影像数据库服务器、医生客户端服务器、第一辅助服务器和第二辅助服务器,解决了全面的提取重要的影响特征,进行特征去冗余,提高结果准确度的技术问题,本发明辅助系统的分类结果比较准确,可以作为医生诊断的重要参考信息,同时本发明可以循环迭代更新,随着数据量的增多,准确率会越来越高。
技术领域
本发明属于大数据技术领域,尤其涉及一种采用机器学习算法对 乳腺癌进行良恶性特征统计的方法。
背景技术
目前对于乳腺癌的诊断主要依靠医生的临床经验,很多医院的医 生水平有限,不能对患者的病情进行准确的判断,这会延误病人的治 疗,如果借助影像组学的方法对乳腺癌的MRI图像进行分析,从而对 病人的病情进行较为准确的判断,将大大减轻医生的压力,帮助医生 制定治疗方案。
然而采用影像组学的方法其在对MRI图像进行分析会产生大量 的特征冗余,其结果准确度低。
发明内容
本发明的目的是提供一种采用机器学习算法对乳腺癌进行良恶 性特征统计的方法,解决了全面的提取重要的影响特征,进行特征去 冗余,提高结果准确度的技术问题。
为实现上述目的,本发明采用如下技术方案:
一种采用机器学习算法对乳腺癌进行良恶性特征统计的方法,包 括如下步骤:
步骤1:建立影像数据库服务器、医生客户端服务器、第一辅助 服务器和第二辅助服务器,影像数据库服务器、医生客户端服务器、 第一辅助服务器和第二辅助服务器之间均通过互联网通信;
影像数据库服务器用于存储所有病人的乳腺MRI图像;
步骤2:医生通过医生客户端服务器读取影像数据库服务器中的 病人的乳腺MRI图像;
医生在医生客户端服务器上对病人的乳腺MRI图像进行肿瘤区域 分割,医生客户端服务器将分割后的病人的乳腺MRI图像保存为分割 文件,并将分割文件传送给数据库服务器进行存储;
数据库服务器将分割文件和病人的乳腺MRI图像归类存储在同一 个文件夹中,生成病人数据包;
步骤3:重复执行步骤2,直到影像数据库服务器中存储的所有病 人的乳腺MRI图像均生成分割文件,并生成病人数据包为止;
步骤4:第二辅助服务器调取影像数据库服务器中所有的病人数 据包作为训练数据,并进行特征提取、特征选择和分类器训练,进而 得到分类器模型,其具体步骤如下:
步骤A1:每一个病人数据包中包含的乳腺MRI图像均拥有2个序 列,分别为T2W序列和T1C序列,T2W序列和T1C序列均包括数张 图片;
步骤A2:特征提取包括使用Pyradiomics2.1.2工具中的python包 对分割文件进行肿瘤最大层面的2D特征提取,2D特征包括一阶统计 特征、2D形状特征、灰度共生矩阵特征和灰度游程长度矩阵纹理特 征;
同时对一阶统计特征和灰度游程长度矩阵纹理特征进行小波变 换;
步骤A3:特征选择包括对所述2D特征进行Box-Cox变换,使得 偏态分布更接近于正态分布;
对所述2D特征进行全局归一化z-score标准化,生成数据集,经 过处理后的2D特征值均值为0,标准差为1;
采用Scikitlearn工具中的分层抽样的方法对数据集进行划分,分 成训练样本和测试样本,训练集样本为N例,测试集样本为M例,N 取值为正整数,M取值为正整数,指定一个用于保证试验的可重复性 的随机数种子,随机数种子的选取只是为了保证每次分层抽样的结果 不变,随机数种子的取值数由用户自由选取;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学,未经郑州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910379311.6/2.html,转载请声明来源钻瓜专利网。