[发明专利]一种抗核抗体荧光核型自动标注方法有效
| 申请号: | 201910926624.9 | 申请日: | 2019-09-27 |
| 公开(公告)号: | CN110705632B | 公开(公告)日: | 2022-03-22 |
| 发明(设计)人: | 高明霞;何林峰;刘毅 | 申请(专利权)人: | 北京工业大学 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/772;G06V10/82;G06K9/62;G06N3/04;G16H30/00 |
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
| 地址: | 100124 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 一种抗核抗体荧光核型自动标注方法属于医疗大数据处理的研究领域。由于已标注的抗核抗体荧光核型图片收集困难,利用少量样本从头学习一个全新的Faster‑RCNN网络结构难以实现。本发明方法的第一步就是针对要识别图片特点,选用一个常见的预训练模型作为初始网络。第二步,比较预训练模型对输入图片的要求与收集到的训练样本实例,进行图片预处理工作,具体包括切割、标注及命名等工作。第三步就是通过上一步获取到的训练样本对带初始化网络的Faster‑RCNN进行训练,并通过迭代优化确定实时参数。获取到合适的Faster‑RCNN模型后,方法的第四步就可以进行新增图片识别与标注工作,当然新增图片同样需要进行必要的预处理,比如切割。 | ||
| 搜索关键词: | 一种 抗体 荧光 核型 自动 标注 方法 | ||
【主权项】:
1.一种抗核抗体荧光核型自动标注方法,其特征在于步骤如下:/n步骤1:收集已标注细胞核均质类型一及细胞核均质类型二的抗核抗体荧光核型图片集合D1及D2及对应XML格式说明数据E1及E2,其中图片大小:m*n像素,标注目标长度范围a~b像素,宽度范围c~d像素,目标相对于图片的最小占比p(x)=(a*c)/(m*n);/n步骤2:下载并安装Tensorflow框架中提供的Faster-RCNN模型到Linux服务器;/n步骤3:下载并安装预训练模型VGG16到Faster-RCNN模型指定目录;/n步骤4:当Max{m,n}>1000,Min{m,n}>600,或p(x)<K1时,K1=0.8%;转移到步骤5使用回退像素方法对图片集合D1及D2进行切割,获取到切割后的图片集合D11及D22;否则,直接重命名图片集合D1及D2成为D111及D222对应说明数据E1及E2成为E11及E22,跳转到步骤7;/n步骤5:每个目标的最大长度为b像素,最大宽度为d像素,为了保证切割时不破坏标注样本,长、宽方向的回退像素距离x1,y1,必须满足x1>b,y1>d;为了预留误差,本发明分别设定x1=1.5*b,y1=1.5*d;/n假设长、宽的回退次数分别是x2、y2,则最终一张图片会被分割成(x2+1)*(y2+1)张图片,分割后每张图片的像素尺寸为X*Y,面积为Q,为满足步骤4中所述的长宽及占比约束,下边公式成立;/n(a*c)/Q>=K1 (1)/n224<Max{X,Y}<1000 (2)/n224<Min{X,Y}<600 (3)/n其中Q=X*Y,X=((m+x1*x2)/(x2+1)),Y=((n+y1*y2)/(y2+1));/n其中公式(2)和(3)是对图片长宽的约束条件,我们要解决的是分割次数,如果忽略回退距离x1,y1就能得到近似等式:X=m/(x2+1),Y=n/(y2+1),将这个等式带入公式(2)和(3),就得到了分割次数的近似约束条件,如公式(4)和(5)所示;/nMax{m,n}/1000<Max{x2+1,y2+1}<Max{m,n}/224 (4)/nMin{m,n}/600<Max{x2+1,y2+1}<Min{m,n}/224 (5)/n通过(4)和(5)可以计算出x2,y2的大致范围,因为分割次数必须是整数且消耗时间应该尽可能少,所以从满足范围的最小整数开始递归枚举分割次数,分割次数每次递增的量是1;直到该分割情况下的占比满足公式(1),则停止枚举;此时x2,y2的取值就是需要的分割次数;对图片集合D1及D2进行对应的回退像素分割,获取到D11及D22;/n如果是未标注图片则跳转到步骤9,否则继续;/n步骤6:采用LabelImg图像标注工具对切割后的图片集合D11及D22分别进行了两种目标样本的手动标注,形成了最终的样本图片集D111、D222及对应说明数据集E11及E22;/n步骤7:配置样本图片集D111、D222及对应说明数据E11及E22到指定目录,开始Faster-RCNN模型训练的过程;预训练模型VGG16的选择相当于选定了一组网络结构以及初始参数,接下来通过多次调整学习率lr及迭代次数te这两个训练过程中的核心参数,找到满足精度性能大于80%的一组参考,获取到一个性能满足条件的可用模型M;/n步骤8:收集需要标注图片集Dx,其中任意图片dx大小:m
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910926624.9/,转载请声明来源钻瓜专利网。





