[发明专利]一种基于全卷积神经网络的真菌显微图像识别方法有效

专利信息
申请号: 201810240366.4 申请日: 2018-03-22
公开(公告)号: CN108520206B 公开(公告)日: 2020-09-29
发明(设计)人: 杨育彬;董剑峰;彭凯宇 申请(专利权)人: 南京大学
主分类号: G06K9/00 分类号: G06K9/00;G06N3/04
代理公司: 江苏圣典律师事务所 32237 代理人: 胡建华;于瀚文
地址: 210023 江苏省南*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 卷积 神经网络 真菌 显微 图像 识别 方法
【权利要求书】:

1.一种基于全卷积神经网络的真菌显微图像识别方法,其特征在于,包括如下步骤:

步骤1,真菌图像采集与标类:采集真菌图像,同时对每张图像进行标类,得到标注好类的原始图像数据集合;

步骤2,数据预处理:对标注好类的原始图像进行缩放和裁剪处理,并对每张图像以50%概率翻转,同时进行归一化处理,得到预处理后的图像集合;

步骤3,构建神经网络:卷积神经网络总深度为11层,卷积核大小为3x3,第2、4、7层步长为2,其余层步长为1;

步骤4,训练神经网络:对所构建神经网络进行训练,以标好的对应类标作为网络监督信息,使用优化算法调整参数使网络输出和真实类标差距尽可能小,得到训练后的神经网络;

步骤5,将训练后的神经网络作为模型,测试真菌图像识别效果,并调整步骤4优化算法参数继续训练,直到验证识别准确率稳定;

步骤1包括:

步骤1-1,使用显微镜对不同类型的真菌进行拍摄,显微镜倍数为20至40倍,图像分辨率统一为640*512,图像背景色统一设置为淡蓝色,RGB值标准为rgb(153,204,255),对所有拍摄图像施加统一亮度光照,亮度值为500sb,最终得到原始图像数据集合;

步骤1-2,对图像进行标注,取标注最多类别作为标注结果,若标注结果均不同,则图像弃用;最终取得的数据集表示为(X,Y),其中X为原始图像数据集合,Y为类标向量,Y={y1,y2,…yn},其中yi为第i张图片类标;

步骤2包括如下步骤:

步骤2-1,计算原始图像数据集合X上每个像素的均值和标准差,使用其值对每张图像进行归一化,设原始图像数据集合X上的所有图像均值图像为标准差为std,对于一张特定图像x,对其进行归一化如下:

x′为图像x归一化后的图像;

步骤2-2,对归一化后的图像进行缩放,对于分辨率不为640*512的图像,若长宽比例为640:512,直接缩放为640*512大小;若长宽比例不为640:512,先根据短边裁剪为640:512比例,再缩放为640*512大小,对缩放后的图像周围8像素进行扩张,像素值置为0,在扩张后的648*520图像上裁剪640*512的图像块,对于每个生成的图像块,以50%概率进行水平翻转;

步骤2-3,原始图像数据集合X经过步骤2-1和步骤2-2的处理后得到图像数据集X’,随机将其中90%的数据与对应的类标向量组成用于训练神经网络的图像数据集A,剩余10%的数据与对应的类标向量组成验证集B;

步骤3包括如下步骤:

步骤3-1,神经网络总深度为11层,其中前10层为卷积层,卷积核大小为3*3,第2、4、7层步长为2,其余层步长为1,对于第i层卷积层,其可训练参数包含权重Wi和偏置bi

步骤3-2,在每层卷积层之后添加BatchNormalization层,对于第k层的特征x(k),通过BatchNormalization层后得到归一化后的特征其具体计算如下:

其中E(x(k))和Var(x(k))分别为当前处理数据束batch的均值和方差:

xi(k)为数据束中第i张图片对应第k层特征向量,第i层Batch Normalization层可训练参数包括γi和βi

步骤3-3,之后添加ReLU非线性层,对于第k层特征x(k),其ReLU层函数ReLU(x(k))计算过程如下:

ReLU(x(k))=max(0,x(k)),

步骤3-4,第10层卷积层后为全局均值池化层,其后为Softmax层,设Softmax 层的输出向量S=Softmax(z),则S为K维向量,其第i维Sj计算公式如下:

其中j=1,2…,K,K为类标总数,即Softmax层输出向量宽度取决于输入数据的类标总数,z表示Softmax层前池化层的K维输出向量,i表示该向量第i维,神经网络输入为图像数据集A中图片,输出为值在0~1之间向量,设为P={p1,p2,…pk},pi值对应于某张图片属于第i类真菌的概率;

步骤4包括如下步骤:

利用反向传播算法训练步骤3中所构建网络的参数,其中优化算法采用ADAM算法,优化最终层的Softmax函数,获得各层梯度后,更新每一层参数,参数包括卷积层权重W和偏置b,Batch Normalization参数γi和βi,初始学习率λ设置为1e-4,训练持续N轮,在第n1、n2和n3轮结束后,将当前学习率乘以g得到新学习率,N轮后直到网络收敛,初始N=200,初始n1=80、n2=120,n3=160,初始g=0.2;

步骤5包括:使用验证集B对步骤4中训练的神经网络进行验证,根据验证集B中的图像识别结果决定是否需要调整步骤4中所涉及的优化参数λ,n1,n2,n3,g继续训练,调整方式如下:

对于λ,设调整之前值为λ0,尝试λ0+1e-5和λ0-1e-5两值,若未有改进则保持原值,否则取准确率最高值,并继续调整,直到准确率不能改进为止;

对于n1,n2,n3,将他们的值加10重新训练,若最终准确率较之前一次不变时停止;

对于g,设调整之前值为g0,尝试g0*0.9和g0*1.1,若准确率未有改进则保持原值,否则取准确率最高值,并继续调整,直到准确率不能改进为止;

当三次验证集B准确率值不变时,判定神经网络收敛,停止训练过程,使用训练好的神经网络作为测试模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810240366.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top