[发明专利]一种基于全卷积神经网络的真菌显微图像识别方法有效

申请号：	201810240366.4	申请日：	2018-03-22
公开（公告）号：	CN108520206B	公开（公告）日：	2020-09-29
发明（设计）人：	杨育彬;董剑峰;彭凯宇	申请（专利权）人：	南京大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06N3/04
代理公司：	江苏圣典律师事务所 32237	代理人：	胡建华;于瀚文
地址：	210023 江苏省南***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于卷积神经网络真菌显微图像识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于全卷积神经网络的真菌显微图像识别方法，其特征在于，包括如下步骤：

步骤1，真菌图像采集与标类：采集真菌图像，同时对每张图像进行标类，得到标注好类的原始图像数据集合；

步骤2，数据预处理：对标注好类的原始图像进行缩放和裁剪处理，并对每张图像以50％概率翻转，同时进行归一化处理，得到预处理后的图像集合；

步骤3，构建神经网络：卷积神经网络总深度为11层，卷积核大小为3x3，第2、4、7层步长为2，其余层步长为1；

步骤4，训练神经网络：对所构建神经网络进行训练，以标好的对应类标作为网络监督信息，使用优化算法调整参数使网络输出和真实类标差距尽可能小，得到训练后的神经网络；

步骤5，将训练后的神经网络作为模型，测试真菌图像识别效果，并调整步骤4优化算法参数继续训练，直到验证识别准确率稳定；

步骤1包括：

步骤1-1，使用显微镜对不同类型的真菌进行拍摄，显微镜倍数为20至40倍，图像分辨率统一为640*512，图像背景色统一设置为淡蓝色，RGB值标准为rgb(153,204,255)，对所有拍摄图像施加统一亮度光照，亮度值为500sb，最终得到原始图像数据集合；

步骤1-2，对图像进行标注，取标注最多类别作为标注结果，若标注结果均不同，则图像弃用；最终取得的数据集表示为(X,Y)，其中X为原始图像数据集合，Y为类标向量，Y＝{y₁,y₂,…y_n}，其中y_i为第i张图片类标；

步骤2包括如下步骤：

步骤2-1，计算原始图像数据集合X上每个像素的均值和标准差，使用其值对每张图像进行归一化，设原始图像数据集合X上的所有图像均值图像为标准差为std，对于一张特定图像x，对其进行归一化如下：

x′为图像x归一化后的图像；

步骤2-2，对归一化后的图像进行缩放，对于分辨率不为640*512的图像，若长宽比例为640:512，直接缩放为640*512大小；若长宽比例不为640:512，先根据短边裁剪为640:512比例，再缩放为640*512大小，对缩放后的图像周围8像素进行扩张，像素值置为0，在扩张后的648*520图像上裁剪640*512的图像块，对于每个生成的图像块，以50％概率进行水平翻转；

步骤2-3，原始图像数据集合X经过步骤2-1和步骤2-2的处理后得到图像数据集X’，随机将其中90％的数据与对应的类标向量组成用于训练神经网络的图像数据集A，剩余10％的数据与对应的类标向量组成验证集B；

步骤3包括如下步骤：

步骤3-1，神经网络总深度为11层，其中前10层为卷积层，卷积核大小为3*3，第2、4、7层步长为2，其余层步长为1，对于第i层卷积层，其可训练参数包含权重W_i和偏置b_i；

步骤3-2，在每层卷积层之后添加BatchNormalization层，对于第k层的特征x^(k)，通过BatchNormalization层后得到归一化后的特征其具体计算如下：

其中E(x^(k))和Var(x^(k))分别为当前处理数据束batch的均值和方差:

x_i^(k)为数据束中第i张图片对应第k层特征向量，第i层Batch Normalization层可训练参数包括γ_i和β_i；

步骤3-3，之后添加ReLU非线性层，对于第k层特征x^(k)，其ReLU层函数ReLU(x^(k))计算过程如下：

ReLU(x^(k))＝max(0，x^(k))，

步骤3-4，第10层卷积层后为全局均值池化层，其后为Softmax层，设Softmax 层的输出向量S＝Softmax(z)，则S为K维向量，其第i维S_j计算公式如下：

其中j＝1,2…,K，K为类标总数，即Softmax层输出向量宽度取决于输入数据的类标总数，z表示Softmax层前池化层的K维输出向量，_i表示该向量第i维，神经网络输入为图像数据集A中图片，输出为值在0～1之间向量，设为P＝{p₁,p₂,…p_k}，p_i值对应于某张图片属于第i类真菌的概率；

步骤4包括如下步骤：

利用反向传播算法训练步骤3中所构建网络的参数，其中优化算法采用ADAM算法，优化最终层的Softmax函数，获得各层梯度后，更新每一层参数，参数包括卷积层权重W和偏置b，Batch Normalization参数γ_i和β_i，初始学习率λ设置为1e-4，训练持续N轮，在第n₁、n₂和n₃轮结束后，将当前学习率乘以g得到新学习率，N轮后直到网络收敛，初始N＝200，初始n₁＝80、n₂＝120，n₃＝160，初始g＝0.2；

步骤5包括：使用验证集B对步骤4中训练的神经网络进行验证，根据验证集B中的图像识别结果决定是否需要调整步骤4中所涉及的优化参数λ，n₁，n₂，n₃，g继续训练，调整方式如下：

对于λ，设调整之前值为λ₀，尝试λ₀+1e-5和λ₀-1e-5两值，若未有改进则保持原值，否则取准确率最高值，并继续调整，直到准确率不能改进为止；

对于n₁，n₂，n₃，将他们的值加10重新训练，若最终准确率较之前一次不变时停止；

对于g，设调整之前值为g₀，尝试g₀*0.9和g₀*1.1，若准确率未有改进则保持原值，否则取准确率最高值，并继续调整，直到准确率不能改进为止；

当三次验证集B准确率值不变时，判定神经网络收敛，停止训练过程，使用训练好的神经网络作为测试模型。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京大学，未经南京大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810240366.4/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于全卷积神经网络的真菌显微图像识别方法有效

专利文献下载