[发明专利]一种基于深度卷积神经网络的模式识别方法有效
| 申请号: | 201811157800.9 | 申请日: | 2018-09-30 |
| 公开(公告)号: | CN109272048B | 公开(公告)日: | 2022-04-12 |
| 发明(设计)人: | 刘博;史超;张佳慧 | 申请(专利权)人: | 北京工业大学 |
| 主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/82;G06K9/62 |
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 卷积 神经网络 模式识别 方法 | ||
本发明公开了一种基于深度卷积神经网络的模式识别方法,主要是一种基于深度卷积神经网络,引入attention机制及图像增强手段的模式识别方法。首先拿到样本数据集,由相关专业人员对数据集图像进行标注,对图像做灰度处理,这样可以凸显出主要目标的轮廓,有利于特征提取,然后利用随机旋转不同角度对数据集进行扩充,再对图像数据做增强以及数据预处理,最后构建出能够高效提取图像特征的深度卷积神经网络,用建立好的数据集进行五折交叉验证对模型进行训练并测试,完成视觉辅助检测模型的构建。本发明在样本识别时运算效率更高,而模型参数减少,降低了资源的占用,以及对软硬件的高需求,可以更好投入到实际使用。
技术领域
本发明属于深度学习计算机视觉领域,主要是一种基于深度卷积神经网络,引入attention机制及图像增强手段的模式识别方法。
背景技术
“特征提取+分类器”是模式识别领域的经典框架,即通过人力构建特征对图像进行表示,再将特征层面的图像数据送入分类器实现目标图像的分类识别。神经学研究表明人类大脑在处理视觉图像的过程并没有对特征进行抽取,而是将信号传入到一个由大量神经元组成的深度网络并层层传递最终得到信号的隐式表达。深度学习正是通过模拟人脑信号的传输过程让图像在网络中传播并输出图像的有效表示。卷积神经网络作为目前广泛应用的深度模型在计算机视觉及图像处理等领域的成功应用引起了人们的广泛关注。相关研究也在大气、医疗、生物等领域取得了较好的实验效果。例如在医疗辅助识别领域,肺癌已经成为致人死亡的恶性疾病中比较典型的一种,肺部在病变前期的症状主要表现为结节,如果能早期发现并治疗将会极大提高存活率。肺部的检查也是每年体检的重要部分,肺部检查中主要手段是电子计算机断层扫描(CT),需要经专业医生逐个检查筛选存在肺结节的病例,工作量巨大并且考验着人工筛查的准确性,具有高度的主观差异性,基于深度学习的方法实现对图像特征进行提取制作的图像识别系统,可以完成甚至超过通过人眼进行识别的工作效果。因此一个计算机视觉辅助检测的方法对于癌症的及早诊断与治疗是非常具有实际意义的。
视觉辅助检测(Visual aided detection,VAD)随着人工智能的不断兴起,已经成为当下的研究热点。近年来国内外学者在各个研究领域也取得了一定的研究成果。例如Zhu等用传统机器学习SVM方法对肺结节进行了初步分类;Hu等利用反向传播神经网络,通过梯度下降算法调节误差来提取图像特征;Krewer等利用边缘纹理特征通过分类器对图像进行分类。然而,这些现有的方法还是具有一定缺陷。首先在对图像标注分割时,需要操作人员具有相关领域的专业知识,能够对标注样本点或纹理特征做出专业解释,而不同的方法提取到的特征可能不尽相同,同时有些图像十分复杂,如果计算机可以实现自动提取图像中特征,对图像进行分类,结果可能会更加客观,分类精度也会更高。
发明内容
本发明要解决的技术问题是,提供一种基于深度卷积神经网络的模式识别方法,首先拿到样本数据集,由相关专业人员对数据集图像进行标注,对图像做灰度处理,这样可以凸显出主要目标的轮廓,有利于特征提取,然后利用随机旋转不同角度对数据集进行扩充,再对图像数据做增强以及数据预处理,最后构建出能够高效提取图像特征的深度卷积神经网络(Convolutional Neural Network,CNN),用建立好的数据集进行五折交叉验证对模型进行训练并测试,完成视觉辅助检测模型(VAD)的构建。
本发明面向待检测图像数据,提出了一种基于深度卷积神经网络的模式识别方法。由于深度学习所需样本量巨大,但某些领域的图像难以获取,在训练过程会有欠拟合或过拟合的情况发生,需要加入一些样本噪声扩充数据集,同时采用五折交叉验证的训练方法,在防止过拟合的同时增加数据集样本量。输入图像的尺寸过大会占用过多不必要的资源,增大模型计算量,将图像进行适当压缩可以避免占用资源过大的问题。同时,在一张图片中可能需要识别的点只集中于某一小区域,因此引入attention机制来优化模型,attention机制可以利用有限的注意力资源从大量信息中快速筛选出高价值信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811157800.9/2.html,转载请声明来源钻瓜专利网。





