[发明专利]一种基于全卷积神经网络的真菌显微图像识别方法有效
申请号: | 201810240366.4 | 申请日: | 2018-03-22 |
公开(公告)号: | CN108520206B | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 杨育彬;董剑峰;彭凯宇 | 申请(专利权)人: | 南京大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华;于瀚文 |
地址: | 210023 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 真菌 显微 图像 识别 方法 | ||
1.一种基于全卷积神经网络的真菌显微图像识别方法,其特征在于,包括如下步骤:
步骤1,真菌图像采集与标类:采集真菌图像,同时对每张图像进行标类,得到标注好类的原始图像数据集合;
步骤2,数据预处理:对标注好类的原始图像进行缩放和裁剪处理,并对每张图像以50%概率翻转,同时进行归一化处理,得到预处理后的图像集合;
步骤3,构建神经网络:卷积神经网络总深度为11层,卷积核大小为3x3,第2、4、7层步长为2,其余层步长为1;
步骤4,训练神经网络:对所构建神经网络进行训练,以标好的对应类标作为网络监督信息,使用优化算法调整参数使网络输出和真实类标差距尽可能小,得到训练后的神经网络;
步骤5,将训练后的神经网络作为模型,测试真菌图像识别效果,并调整步骤4优化算法参数继续训练,直到验证识别准确率稳定;
步骤1包括:
步骤1-1,使用显微镜对不同类型的真菌进行拍摄,显微镜倍数为20至40倍,图像分辨率统一为640*512,图像背景色统一设置为淡蓝色,RGB值标准为rgb(153,204,255),对所有拍摄图像施加统一亮度光照,亮度值为500sb,最终得到原始图像数据集合;
步骤1-2,对图像进行标注,取标注最多类别作为标注结果,若标注结果均不同,则图像弃用;最终取得的数据集表示为(X,Y),其中X为原始图像数据集合,Y为类标向量,Y={y1,y2,…yn},其中yi为第i张图片类标;
步骤2包括如下步骤:
步骤2-1,计算原始图像数据集合X上每个像素的均值和标准差,使用其值对每张图像进行归一化,设原始图像数据集合X上的所有图像均值图像为标准差为std,对于一张特定图像x,对其进行归一化如下:
x′为图像x归一化后的图像;
步骤2-2,对归一化后的图像进行缩放,对于分辨率不为640*512的图像,若长宽比例为640:512,直接缩放为640*512大小;若长宽比例不为640:512,先根据短边裁剪为640:512比例,再缩放为640*512大小,对缩放后的图像周围8像素进行扩张,像素值置为0,在扩张后的648*520图像上裁剪640*512的图像块,对于每个生成的图像块,以50%概率进行水平翻转;
步骤2-3,原始图像数据集合X经过步骤2-1和步骤2-2的处理后得到图像数据集X’,随机将其中90%的数据与对应的类标向量组成用于训练神经网络的图像数据集A,剩余10%的数据与对应的类标向量组成验证集B;
步骤3包括如下步骤:
步骤3-1,神经网络总深度为11层,其中前10层为卷积层,卷积核大小为3*3,第2、4、7层步长为2,其余层步长为1,对于第i层卷积层,其可训练参数包含权重Wi和偏置bi;
步骤3-2,在每层卷积层之后添加BatchNormalization层,对于第k层的特征x(k),通过BatchNormalization层后得到归一化后的特征其具体计算如下:
其中E(x(k))和Var(x(k))分别为当前处理数据束batch的均值和方差:
xi(k)为数据束中第i张图片对应第k层特征向量,第i层Batch Normalization层可训练参数包括γi和βi;
步骤3-3,之后添加ReLU非线性层,对于第k层特征x(k),其ReLU层函数ReLU(x(k))计算过程如下:
ReLU(x(k))=max(0,x(k)),
步骤3-4,第10层卷积层后为全局均值池化层,其后为Softmax层,设Softmax 层的输出向量S=Softmax(z),则S为K维向量,其第i维Sj计算公式如下:
其中j=1,2…,K,K为类标总数,即Softmax层输出向量宽度取决于输入数据的类标总数,z表示Softmax层前池化层的K维输出向量,i表示该向量第i维,神经网络输入为图像数据集A中图片,输出为值在0~1之间向量,设为P={p1,p2,…pk},pi值对应于某张图片属于第i类真菌的概率;
步骤4包括如下步骤:
利用反向传播算法训练步骤3中所构建网络的参数,其中优化算法采用ADAM算法,优化最终层的Softmax函数,获得各层梯度后,更新每一层参数,参数包括卷积层权重W和偏置b,Batch Normalization参数γi和βi,初始学习率λ设置为1e-4,训练持续N轮,在第n1、n2和n3轮结束后,将当前学习率乘以g得到新学习率,N轮后直到网络收敛,初始N=200,初始n1=80、n2=120,n3=160,初始g=0.2;
步骤5包括:使用验证集B对步骤4中训练的神经网络进行验证,根据验证集B中的图像识别结果决定是否需要调整步骤4中所涉及的优化参数λ,n1,n2,n3,g继续训练,调整方式如下:
对于λ,设调整之前值为λ0,尝试λ0+1e-5和λ0-1e-5两值,若未有改进则保持原值,否则取准确率最高值,并继续调整,直到准确率不能改进为止;
对于n1,n2,n3,将他们的值加10重新训练,若最终准确率较之前一次不变时停止;
对于g,设调整之前值为g0,尝试g0*0.9和g0*1.1,若准确率未有改进则保持原值,否则取准确率最高值,并继续调整,直到准确率不能改进为止;
当三次验证集B准确率值不变时,判定神经网络收敛,停止训练过程,使用训练好的神经网络作为测试模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810240366.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种人脸识别方法
- 下一篇:一种基于插值的经验最优包络方法