[发明专利]一种数据集中含有不确定数据时的肺结节图像分类方法有效
| 申请号: | 201910489713.1 | 申请日: | 2019-06-06 |
| 公开(公告)号: | CN110223281B | 公开(公告)日: | 2022-06-28 |
| 发明(设计)人: | 毛克明;王新琦;常辉东;李佳明;李翰鹏 | 申请(专利权)人: | 东北大学 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V10/774;G06K9/62 |
| 代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 梁焱 |
| 地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据 集中 含有 不确定 结节 图像 分类 方法 | ||
本发明涉及计算机视觉技术领域,提供一种数据集中含有不确定数据时的肺结节图像分类方法。首先,收集肺结节CT图像集并利用专家投票法通过多数投票原则确定图像的类别,经过预处理后得到肺结节CT图像数据集;然后,基于知识蒸馏法,构建包括教师模型、学生模型的肺结节图像分类模型;接着,获取确定标签数据集,在确定标签数据集上训练教师模型,并在肺结节CT图像数据集上计算软标签;然后,在联合硬标签和软标签的数据集上训练学生模型;最后,将预处理后的待分类肺结节CT图像输入训练后的肺结节图像分类模型中,获得其类别。本发明能够有效利用数据集中的不确定标签数据,提升肺结节诊断的准确性和效率,且易用性和鲁棒性高。
技术领域
本发明涉及计算机视觉技术领域,特别是涉及一种数据集中含有不确定数据时的肺结节图像分类方法。
背景技术
肺癌是世界上最致命的疾病之一,2017年肺癌约占所有癌症发病人数的26%。尽管最近的诊断和治疗取得了长足的发展,但肺癌五年治愈率仅为18%。值得注意的是,如果患者能够进行早期准确诊断并且实施适当的治疗,那么这一比率将大大增加。低剂量计算机断层扫描(CT)已被广泛用于肺癌检查,与其他成像技术相比,CT可以显示低对比度的结节,具有更多优势。根据全国肺部筛查的报告,低剂量CT扫描可将肺癌死亡率降低20%。传统的肺结节诊断主要依赖医生专家的观察,因此会有一些缺点:诊断结果具有主观性;工作量大耗时长;人类视觉局限性;偏远地区医生无法普及。随着计算机视觉技术的发展,特别是自动分类识别技术取得的进步,通过提供有价值的意见来帮助临床医生进行诊断。
现在计算机视觉和机器学习技术的发展使快速和可靠的CT图像分类成为可能,因其高效和减少人工等优势成为热门的研究领域。一些有代表性的工作包括采用基于肺结节图像的低维度特征,包括纹理、形状、滤波和强度等;还有一些算法采用一些在计算机视觉领域中精心设计的特征提取和表示方法,如SIFT,HOG,LBP特征等;随着计算能力的提高和深度学习的兴起,基于深度学习的目标检测和识别性能,不论是检测速度还是检测准确度都获得了很大的提高。深度学习模型可以描述肺结节图像的高级抽象,具有强大的特征提取能力和泛化能力,因此深度学习方法的效果远远好于传统机器学习方法。但是神经网络模型的训练需要大量的标注正确的数据。因为医学影像标注的专业性和特殊性,还有道德法律的限制,所以获得大量的训练数据是一件困难的事情。在一般的公共数据集中包括以下问题:(i)数据集规模小,类别分布不平衡;(ii)包含噪音和不确定的标签。以LIDC-IDRI数据集为例,肺部CT图片通过多个专家进行标注,每个专家标注数据的一部分,每个数据也被多个专家标注,虽然工作量减少并能给出相对较好的标注结果,但是不同的专家水平不同,会产生很多不统一的标签;其次,数据中有许多被判定为不确定类型的数据和无标签的数据,传统的处理方法是将不确定类型的数据直接舍弃,但这种做法会丢失很多有价值的信息。
因此,针对肺结节图像数据集包含不统一标签和不确定数据的现状,急需要一种可以高效处理和分类CT图像中肺结节良恶性的方法。
发明内容
针对现有技术存在的问题,本发明提供一种数据集中含有不确定数据时的肺结节图像分类方法,能够有效利用数据集中的不确定标签数据,提升肺结节诊断的准确性和效率,且易用性和鲁棒性高。
本发明的技术方案为:
一种数据集中含有不确定数据时的肺结节图像分类方法,其特征在于,包括下述步骤:
步骤1:组织数据集:收集N张肺结节CT图像构成图像集I={I1,I2,...,In,...,IN},将肺结节分为良性、恶性和不确定三种类型;采用专家法对每张肺结节CT图像进行类别标注,得到第n张肺结节CT图像In的类别为en;对每张肺结节CT图像进行预处理,得到肺结节CT图像数据集D;所述预处理包括将肺结节CT图像转换为JPG格式并对转换后的图像进行裁剪、尺寸调整、数据增强预处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910489713.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





