[发明专利]一种基于深度学习的染色体自动计数方法有效
申请号: | 201811250267.0 | 申请日: | 2018-10-25 |
公开(公告)号: | CN109523520B | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 乔杰;赵屹;田婵;肖立;于天琦;罗纯龙;于富海;罗宇凡;王曼卿;赵相然 | 申请(专利权)人: | 北京大学第三医院;中国科学院计算技术研究所 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06K9/00;G06N3/04 |
代理公司: | 北京市众天律师事务所 11478 | 代理人: | 李新军 |
地址: | 100191 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 染色体 自动 计数 方法 | ||
1.一种基于深度学习的染色体自动计数方法,所述方法包括以下步骤:
(1)图像收集和预处理步骤:收集并标注显微镜下分裂中期细胞真实影像图,标记出染色体的矩形框,并随机划分训练集和测试集,对训练集数据进行预处理和数据扩增;
(2)图像分类和回归步骤:以步骤(1)预处理和扩增后数据为基础构建Faster R-CNN模型进行图像分类和回归,所述模型包括对数据进行粗分类和回归的候选区域提取网络、以及对候选区域提取网络生成的候选框进行细分类和精确回归预测的Fast R-CNN网络,其中,候选区域提取网络的抽样范围包括困难负例,Fast R-CNN网络的多任务损失函数为原始Fast R-CNN的多任务损失函数与截断的归一化排斥损失函数之和;所述的截断的归一化排斥损失函数为式(I)所示:
其中,
其中,P+是由候选区域提取网络产生且与某个ground-truth的IoU大于0.5的候选矩形框的集合,P是属于P+的一个候选矩形框,BP是由Faster R-CNN对P进行回归之后的预测框,GP是与P的IoU最大的ground-truth,RP是与P的IoU第二大的ground-truth,当预测候选框偏移真实目标时,根据偏移量的大小,损失函数会在0到1之间连续变化;所述的Fast R-CNN网络的多任务损失函数为(III)所示:
Ltotal=Lreg+Lcls+αgLTNRepulsion (III)
其中,Lreg为原始Fast R-CNN的回归损失函数,Lcls为原始Fast R-CNN的分类损失函数,α是衡量排斥损失重要程度的权重系数;
(3)模型训练步骤:使用步骤(2)建立的模型针对训练集数据进行模型训练;
(4)测试计数步骤:将测试集数据经过与步骤(1)相同的数据预处理,输入到经过步骤(3)训练后的模型中,获得预测的目标类别和目标计数信息,并以可视化方式输出计数结果。
2.根据权利要求1所述的方法,其特征在于,所述步骤(2)的困难负例在抽样样本总数中占比0.375,其候选矩形框与真实目标矩形框的IoU介于0.3-0.7之间。
3.根据权利要求1所述的方法,其特征在于,步骤(2)所述原始Fast R-CNN的多任务损失函数为分类损失函数和回归损失函数的和,其中,分类损失函数为式(IV):
其中,N代表计入损失的样本数;pi代表样本预测为前景染色体的概率;回归损失函数采用损失函数,其函数形式为式(V):
其中,
其中,x,y,w,h分别代表矩形框中心点的横纵坐标以及矩形框长度和高度;
多任务损失函数为式(VII)所示:
其中,回归损失仅计算真实标注为“1”的模板框,即pi*=1的模板框才纳入回归损失的计算范围。
4.根据权利要求1所述的方法,其特征在于,所述步骤(3)中的模型训练选择Momentum算法作为梯度下降方法,momentum=0.9,学习率初始化为0.001;每轮迭代Batch size=1;学习率衰减采用指数式衰减,每40000轮学习率衰减为原来的0.1倍;模型迭代训练100000轮。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学第三医院;中国科学院计算技术研究所,未经北京大学第三医院;中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811250267.0/1.html,转载请声明来源钻瓜专利网。