[发明专利]一种识别清洗食材图片的模型及识别食材类别的方法在审
申请号: | 201710776039.6 | 申请日: | 2017-08-31 |
公开(公告)号: | CN107563439A | 公开(公告)日: | 2018-01-09 |
发明(设计)人: | 吴淇;肖光意;王换文;郑瀚韬;何珍;陈浩;胡超慧;王宇 | 申请(专利权)人: | 湖南麓川信息科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 成都环泰知识产权代理事务所(特殊普通合伙)51242 | 代理人: | 邹翠,李斌 |
地址: | 410005 湖南省长沙市高新开发区谷苑路*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 清洗 图片 模型 类别 方法 | ||
技术领域
本发明属于食材识别技术领域,尤其涉及一种识别清洗食材图片的模型及识别食材类别的方法。
背景技术
餐饮行业是国民经济支柱产业之一,如何对食材进行快速分类和精准检测是餐饮行业中食材质量控制和食品安全监测的核心和关键问题。传统食材采购对食材进行基于文本分类的标签分类方式不能满足日益增长的业务需求,如何对食材图像实现快速高效的分类成为亟待解决的难题。
数据清洗是对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。针对图像预处理过程中,人工方式清洗需要花费大量的人力、物力和时间成本,并且清洗过程很容易因人为因素产生错误的问题。
传统的技术方案在进行图像分类时,首先是对图片提取一定量的特征点,其次通过数据模型来对提取的图像信息进行建模分析及表达,并最终利用图像匹配的方法来对图像进行识别。利用传统的图像分类方法进行图像分类时识别的准确率和识别效率都不能满足实际应用的需求这一问题,在实际应用场合中,食材图像具有背景复杂多变、旋转、尺度、光线多变不固定等特点,传统的识别方法无法在这种复杂情况下保持稳定。
现在还没有实时在线检测的技术,因此本发明构建在线平台,为用户提供随时随地的在线识别分类的服务。
综上所述,现有技术存在的问题是:
现有技术的图像预处理过程中,人工方式清洗需要花费大量的人力、物力和时间成本,并且清洗过程很容易因人为因素产生错误。在实际应用场合中,食材图像具有背景复杂多变、旋转、尺度、光线多变不固定等特点,因此给传统的图像分类方法带来了很大的挑战;传统的食材类别识别算法效率低下,并且食材种类复杂,目前还未见针对肉类识别的研究。
发明内容
针对现有技术存在的问题,本发明提供了一种识别清洗食材图片的模型及识别食材类别的方法。
本发明是这样实现的,一种快速识别食材类别的方法,所述快速识别食材类别的方法,包括:
本发明利用基于卷积神经网络的图像分类模型,首先给定一个K类的词库和Yes/No clean标签,其中模型中两个CNN模型将分别对类标签和clean标签进行卷积运算,经过前向传播后,优化softmax层,然后再将特定参数在反向传播中进行传播。将清洗后且标注了Yes/No和类标签的图像,用于整个网络中进行迭代,得到模型,实现自动清洗图片以及识别食材类别的方法。
进一步,分别采用AlexNet,VGG-16及CaffeNet这三个卷积神经网络来对实验数据集进行实验,寻找最适合食材图像分类的卷积神经网络架构;并对卷积神经网络架构进行参数调优;具体包括:
步骤一、将图片转换成lmdb格式并计算均值文件:在caffe-master根目录下examples文件夹下面创建一个demo的文件夹,来用存放配置文件和脚本文件。然后编写一个脚本create_filelist.sh,用来生成train.txt和test.txt清单文件,调用convert_imageset命令来转换数据格式,统一转换成640*480大小。运行成功后,会在examples/demo下面生成两个文件夹img_train_lmdb和img_test_lmdb,分别用于保存图片转换后的lmdb文件。
步骤二:构建用于训练的模型:图片减去均值再训练,会提高训练速度和精度,使用计算均值的文件compute_image_mean.cpp,会在examples/myfile/下面生成一个mean.binaryproto的均值文件,再调用models/bvlc_reference_caffenet/文件夹下的模型用于训练。
步骤三:配置train.prototxt及solver.prototxt文件中的参数,用于模型进行训练,修改train.prototxt文件的data层,以及solver.prototxt文件的batch_size以及test_iter。
步骤四:从训练的卷积网络的所有模型中,选出最低损失率和最高精确度的模型,然后用测试数据集对选定的模型进行训练。
进一步,所述步骤一中,lmdb为容易被Caffe框架所处理的图像格式;
所述步骤三的train.prototxt和solver.prototxt文件中,设置许多超级参数用来使卷积网络获得识别率,同时,对参数进行调优。
本发明另一目的在于提供一种识别清洗食材图片的模型为多任务Auto-Clean卷积神经网络模型;所述多任务Auto-Clean卷积神经网络模型包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南麓川信息科技有限公司,未经湖南麓川信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710776039.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种快速鲁棒的多模态遥感影像匹配方法和系统
- 下一篇:一种图像处理方法及装置