[发明专利]一种医学图像分割数据自动标注的方法在审
| 申请号: | 202310438250.2 | 申请日: | 2023-04-14 |
| 公开(公告)号: | CN116469103A | 公开(公告)日: | 2023-07-21 |
| 发明(设计)人: | 袁克虹 | 申请(专利权)人: | 清华大学深圳国际研究生院 |
| 主分类号: | G06V20/70 | 分类号: | G06V20/70;G06V10/26;G06V10/82;G06T7/13;G06N3/0455;G06N3/048;G06N3/09 |
| 代理公司: | 北京市诚辉律师事务所 11430 | 代理人: | 耿慧敏;朱伟军 |
| 地址: | 518055 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 医学 图像 分割 数据 自动 标注 方法 | ||
本发明公开了一种医学图像分割数据自动标注的方法。该方法包括:获取已标注数据集和未标注数据集;使用所述已标注数据集以全监督方式训练生成模型和语义分割模型,其中所述生成模型用于从掩码生成图像;利于经训练的生成模型和语义分割模型经过多次迭代标注过程获得所述未标注数据的标注结果,在迭代标注过程中,所述已标注数据集和所述生成模型固定不变,仅持续优化所述语义分割模型,该语义分割模型用于针对未标注数据生成伪标签。本发明通过结合少量已标注数据和生成模型,提升了标注效率,并通过引入强的先验知识,自动精确地标注医学图像。
技术领域
本发明涉及医学图像处理技术领域,更具体地,涉及一种医学图像分割数据自动标注的方法。
背景技术
在基于深度学习的语义分割任务中,监督学习仍然是精确度最高且主流的方法,这是因为监督学习可以利用大量带标签的训练数据进行模型训练,从而获得高精度的结果。然而,监督学习相对于半监督或无监督技术,需要大量高精度的标签,标注数据的成本较高。尤其在一些特定领域,如医疗影像分析、工业缺陷检测等。目前深度学习在学术研究和工业应用中,数据标注仍然主要采用将数据标注任务分配给第三方服务提供商或个人的人工外包方式。这是因为许多数据集需要高度精确的标注与专业的知识储备,最典型的便是医学图像领域,自动化标注技术还不能完全胜任具有丰富经验医生的标注。
现有的高性能深度学习方法通常依赖于具有高质量手动注释的大型训练数据集,这在许多临床应用中很难获得。目前,主流的数据标注主要是高度依赖于人工的半自动化标注。特别是对于医疗领域,人工标注需要专业的医生去做,专家医生对数据进行逐一标注,这种方式的优点是可以保证数据的准确性和标注的质量,但是其高昂的人工成本和标注速度,成为了深度学习在临床中应用的验证阻碍。而对于外包形式,由于专业知识的缺乏,在标注过程中存在一定的主观误差,从而影响标注数据的准确性和一致性。
相对人工标注,使用生成模型可以快速生成大量的数据标签对,但目前的基于深度学习的医学图像生成技术仍然存在以下亟待解决的问题:
(1)数据稀缺问题。对于医疗图像分割任务,高质量的带有标注的数据很难获取,这主要是因为:罕见疾病的数据稀少,且多中心数据因隐私等问题难以大量集中获取;像素级的数据标注需要大量专业医师手动标注,耗时耗力,在基于深度学习的临床应用中很难实现。因而亟需快速高质量的自动化标注方案来推进深度学习在临床图像分割任务的落地。
(2)真实性问题。医学图像需要准确地反映人体解剖结构、病理变化等,而生成网络很难去保证学习到该领域的专业知识,因此生成网络生成的医学图像可能存在真实性问题。如果生成的图像不真实,用此数据训练的模型可能会影响对病情的判断和诊断结果。
(3)多样性问题。在医学图像处理领域,病灶的位置、形状和像素分布通常会因为疾病的种类、患者的差异等而有很大的区别。相比于自然图像领域,医学图像的数据集往往更加有限,难以涵盖所有可能的情况,因此很难训练出能够有效处理医学图像的模型,在这种情况下,模式崩塌问题就更容易出现,即模型在生成图像时缺乏多样性和细节,不能很好地反映真实情况,从而严重影响模型的应用价值。
发明内容
本发明的目的是克服上述现有技术的缺陷,提供一种医学图像分割数据自动标注的方法。该方法包括以下步骤:
获取已标注数据集和未标注数据集;
使用所述已标注数据集以全监督方式训练生成模型和语义分割模型,其中所述生成模型用于从掩码生成图像;
利于经训练的生成模型和语义分割模型经过多次迭代标注过程获得所述未标注数据的标注结果,在迭代标注过程中,所述已标注数据集和所述生成模型固定不变,仅持续优化所述语义分割模型,该语义分割模型用于针对未标注数据生成伪标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310438250.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:专有名词纠错方法、装置、设备及计算机可读介质
- 下一篇:U型螺栓打磨抛光机
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





