[发明专利]基于随机性的典型成团细胞核图像合成方法有效
申请号: | 201710544900.6 | 申请日: | 2017-07-06 |
公开(公告)号: | CN107492084B | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 何勇军;余莲;赵晶;谢怡宁;孙广路 | 申请(专利权)人: | 哈尔滨理工大学 |
主分类号: | G06T5/50 | 分类号: | G06T5/50;G06T7/13;G06T7/136 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150000 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 随机性 典型 成团 细胞核 图像 合成 方法 | ||
基于随机性的成团细胞核图像合成方法,本发明涉及DNA倍体分析技术中,由于成团细胞核图像稀少导致细胞分类正确率急剧下降的问题。细胞DNA倍体分析技术是一种自动化的病理诊断技术,准确识别各类细胞图像是这一技术的关键。然而,重叠细胞核的训练样本稀少(训练集失衡)导致重叠细胞核图片的识别率较低。为解决这一问题,本发明提出了一种合成重叠细胞图像的方法。该方法采用样本选择使合成的样本更具有代表性;引入随机性控制合成源图像的随机旋转角度和随机重叠程度;根据朗伯比尔定律重构重叠部分的像素,使合成的样本更接近真实样本;最后将合成的样本用于模型训练。本发明应用于解决重叠细胞核的训练样本稀少(训练集失衡)问题。
技术领域
本发明设计基于随机性的典型成团细胞核图像合成方法
背景技术
近年来全球范围内宫颈癌的发病率呈逐年上升趋势,已经成为威胁妇女生命的社会问题。然而大多数宫颈病变可以在早期发现,因此早诊断早治疗是应对宫颈癌的有效途径。细胞涂片检查是目前宫颈癌筛查的主流方法。一方面需要耗费大量的人力物力;另一方面医生镜下观察具有主观性,容易因为视觉疲劳产生人为误差。因此自动化的阅片技术变得越来越重要。
DNA倍体分析技术是近年来迅速发展起来的自动阅片技术。有效的将病理学专家的诊断经验与计算机的精确计算和快速处理能力结合起来,实现对宫颈细胞图像的识别和诊断。该技术只对细胞核染色,在软件的控制下自动聚焦扫描,拍摄镜下图片,并在识别的基础上准确测量细胞核内DNA的相对含量。最后将异常的细胞罗列出来,辅助医生诊断。然而细胞核重叠的情况无法避免,且其中出现异常细胞可能性较大。因此,对重叠细胞核(成团细胞核)的分析就显得非常必要。准确识别重叠细胞是进一步做图像分割和测量的前提。样本缺乏会严重影响倍体分析系统的识别性能。
由于标本中重叠细胞核种类繁多(细胞个数和重叠方式),收集大量重叠细胞核费时费力,难以获得足够的训练样本。这使得成团细胞核的训练图片数量远远少于其他类别的图片数量,在细胞分类方面面临着训练数据类别不平衡问题。现有的大多数学习算法和评价准则偏重于大类样本,忽略了小样本,这使分类器的性能降低。现有的大多数学习算法和评价准则偏重于大类样本,忽略了小样本,这使分类器的在失衡数据集上的性能降低。在不增加新样本的前提下,解决这一问题有两种策略。第一种立足于用现有的样本产生新的样本,增加训练数据不足类别的样本数量,代表性的方法有样本重采样和特征选择。第二种改进模型训练算法,提升少样本类别的重要性,典型的有代价敏感学习方法和单类学习方法。因此,采用过采样(over-sampling)技术合成大量训练样本,使不平衡的训练样本变得相对平衡。
目前很多增加小类样本的过采样方法主要有合成少数类的过采样技术(SMOTE),Borderlin-SMOTE算法,MSYN算法,基于k-means算法和遗传算法的过采样技术,基于进化聚类的过采样集成方法等等。目前的方法主要立足于在特征域学习小样本类别的概率分布,以此作为先验来产生新的样本特征值,并将这些数据用于模型训练。由于重叠细胞是由单细胞重叠而成,我们又拥有大量的单细胞图像。如果能在图像数据域真实地模拟重叠过程,则可以产生足够且真实的重叠细胞图像用于特征提取和模型训练。因此,提出利用单细胞图片合成成团细胞图像的方法,利用形成重叠细胞核图像的先验知识,模拟重叠细胞形成的真实过程。为了使合成的细胞尽可能地接近真实,我们考虑了三个方面的问题。为了确保合成的细胞具有代表性,我们对单细胞进行筛选,获得典型的单细胞图像用于合成。为了避免合成的数据偏向固定的分布,在细胞的旋转角度和重叠程度两个方面引入和随机性。为使重叠部分真实,根据朗伯比尔定律重构重叠部分的像素。实验表明,向小类样本加入合成数据后,在人工神经网络(MLP)、支持向量机(SVM)、混合高斯模型(GMM)三种分类器上都取得了识别率的提升;
发明内容
本发明的目的是为了解决重叠细胞核图片稀少导致模型训练不充分,DNA倍体分析系统对细胞识别率不高的问题,而提出的一种基于随机性的典型成团细胞核图像合成方法。
本发明主要技术方案如下:
S1、对选择合成的原图像进行选择并筛选:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710544900.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种夜视图像增强处理方法
- 下一篇:基于双树复小波变换的立体图像质量评价方法