[发明专利]一种肺癌病理图像数据集的构建方法在审
申请号: | 201810510872.0 | 申请日: | 2018-05-24 |
公开(公告)号: | CN108764329A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 王桂芳;蒋龙泉;薛丽敏;唐剑敏;黄致远;汤德凯;冯瑞 | 申请(专利权)人: | 复旦大学附属华山医院北院;复旦大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06T7/00 |
代理公司: | 上海申新律师事务所 31272 | 代理人: | 俞涤炯 |
地址: | 201900 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 病理图像 数据集 构建 肺癌 参考标准 样本数据 癌细胞 分析模型 原始数据 肺组织 核查 迭代训练 人工标注 准确率 工作量 抽样 检测 | ||
本发明涉及一种肺癌病理图像数据集的构建方法,包括以下步骤:步骤S1:构建肺组织病理图像的参考标准数据集;步骤S2:构建癌细胞分析模型;步骤S3:构建肺癌病理图像样本数据集。其优点在于,通过人工标注少量原始数据构建肺癌病理图像参考标准数据集,然后对参考标准数据集进行训练以构建基于少量数据集的癌细胞分析模型,使用模型对肺组织病理图像原始数据进行癌细胞的检测识别,生成肺癌病理图像样本数据集;对样本数据集进行人工抽样核查,将核查过的数据加入肺癌病理图像参考标准数据集,然后对数据集和模型进行迭代训练,提高肺癌病理图像样本数据集的准确率;有效提高构建速度,解决构建肺癌病理图像数据集工作量大、工作时间长的问题。
技术领域
本发明涉及图像识别技术领域,尤其涉及一种肺癌病理图像数据集的构建方法。
背景技术
深度学习技术近年来发展迅速,在很多领域获得了巨大的成功,有研究表明深度学习在医疗影像领域的检测识别方面已经取得了一定的成果,已经表现出巨大的应用潜力,有望在肺癌病理图像识别中达到病理诊断专家的精度、实现比病理诊断专家更快的速度。
构建性能优异的深度学习模型需要依赖大规模高质量的样本数据集,然而目前本领域缺少大规模肺癌病理图像样本数据集,很多医院都有大量真实病例的肺组织病理切片图像数据,对这些图像数据进行样本标注需要大量的人力和时间,据统计,病理诊断专家诊断每张图像的时间需要约3分钟,完全基于人工标注无法构建大规模肺癌病理图像样本数据集,所以需要一种大规模肺癌病理图像数据集的构建方法。
因此,亟需一种能够构建识别处理速度快、准确率高、数据库大的数据集的方法。
发明内容
本发明的目的是针对现有技术中的不足,提供一种肺癌病理图像数据集的构建方法。
为实现上述目的,本发明采取的技术方案是:
一种肺癌病理图像数据集的构建方法,包括以下步骤:
步骤S1:构建肺组织病理图像的参考标准数据集
在N张肺组织病理图像中任意选取n张肺组织病理图像,并对选取得到的n(n<N)张所述肺组织病理图像进行标注,使用标注后的所述肺组织病理图像构建参考标准数据集;
步骤S2:构建癌细胞分析模型
基于深度神经网络构建所述癌细胞分析模型,并采用所述步骤S1构建的所述参考标准数据集对所述癌细胞分析模型进行训练;
步骤S3:构建肺癌病理图像样本数据集
采用经所述步骤S2训练后的所述癌细胞分析模型对剩余的所述肺组织病理图像进行检测识别,构建肺癌病理图像样本数据集。
优选的,还包括:
步骤S4:更新参考标准数据集
在所述步骤S3构建的所述肺癌病理图像样本数据集中任意选取m(m<N)张肺组织病理图像,并对m张所述肺组织病理图像进行评估,并将评估后的m张所述肺组织病理图像添加至所述参考标准数据集以更新所述参考标准数据集。
优选的,还包括:
步骤S5:优化癌细胞分析模型
采用经步骤S4更新后的所述参考标准数据集对步骤S2构建的所述癌细胞分析模型进行训练,获得性能优化的所述癌细胞分析模型。
优选的,还包括:
步骤S6:更新肺癌病理图像样本数据集
采用经步骤S5优化后的所述癌细胞分析模型对步骤S3构建的所述肺癌病理图像样本数据集进行检测识别,更新所述肺癌病理图像样本数据集。
优选的,所述癌细胞分析模型包括癌细胞检测模型和癌细胞识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学附属华山医院北院;复旦大学,未经复旦大学附属华山医院北院;复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810510872.0/2.html,转载请声明来源钻瓜专利网。