[发明专利]一种基于yolov5的蔬菜种类检测与识别方法在审
申请号: | 202011547550.7 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112668445A | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 段连元 | 申请(专利权)人: | 南京泓图人工智能技术研究院有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/46;G06K9/62;G06N3/08 |
代理公司: | 天津垠坤知识产权代理有限公司 12248 | 代理人: | 王忠玮 |
地址: | 210019 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 yolov5 蔬菜 种类 检测 识别 方法 | ||
本发明提供一种基于yolov5的蔬菜种类检测与识别方法,包括模型训练过程和模型应用过程,模型训练过程步骤如下:准备包含各类蔬菜的照片数据;标注照片数据中的蔬菜区域的类别,采用边框框出蔬菜区域,定义此边框为真实的边框;将标注好的照片数据输入YOLOv5网络模型进行训练,得到训练结果并获得模型权重文件。本发明能够自动检测识别蔬菜,可以方便超市和菜市场对蔬菜的管理,减少资源的消耗,同时提高工作效率,本发明同时具备较高的准确率和实时性,为蔬菜市场提供高效的管理办法,使得买家在购买蔬菜时,不需要工作人员的帮助就可以自动完成购买活动,提高蔬菜购买的效率,减少市场管理资源的消耗,加速智能信息时代的经济发展。
技术领域
本发明涉及计算机领域,具体为一种基于yolov5的蔬菜种类检测与识别方法。
背景技术
计算机视觉是一门研究如何使机器看的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取'信息'的人工智能系统。这里所指的信息指Shannon定义的,可以用来帮助做一个决定的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中感知的科学。
而近年来深度学习在计算机视觉领域的飞速发展,让机器自动检测识别蔬菜成为可能,目前在超市或者菜市场,人们一般采用的是工作人员手动记忆分辨、二维码或条形码扫描等方式对蔬菜进行分类识别,这种方式会消耗较大的人力和物力,已经难以满足智能信息时代的需求。
发明内容
本发明目的在于提供一种基于yolov5的蔬菜种类检测与识别方法,具备较高的准确率和实时性,为蔬菜市场提供高效的管理办法,使得买家在购买蔬菜时,不需要工作人员的帮助就可以自动完成购买活动,提高蔬菜购买的效率,减少市场管理资源的消耗,加速智能信息时代的经济发展。
为达成上述目的,本发明提出如下技术方案:一种基于yolov5的蔬菜种类检测与识别方法,包括模型训练过程和模型应用过程,模型训练过程步骤如下:
准备包含各类蔬菜的照片数据;
标注照片数据中的蔬菜区域的类别,采用边框框出蔬菜区域,定义此边框为真实的边框;
将标注好的照片数据输入YOLOv5网络模型进行训练,得到训练结果并获得模型权重文件;
模型应用过程步骤如下:
使用拍照设备采集蔬菜的清晰、光照均匀的照片;
加载训练好的YOLOv5网络模型,将蔬菜图片输入训练好的YOLOv5网络模型进行预测;
得到蔬菜区域及类别和数量信息,为之后计算蔬菜价格等后序操作作准备。
进一步的,在本发明中,所述YOLOv5网络模型包括:
Backbone,同图像细粒度上聚合并形成图像特征的卷积神经网络;
Neck,一系列混合和组合图像特征的网络层,并将图像特征传递到预测层;
Head,对图像特征进行预测,生成边界框并预测类别定义此边界框为预测的边框;
Backbone和Neck用于提取图像特征,图像特征即为输入图片预测框中各种蔬菜的特征,ead用于特征检测和预测类别。
进一步的,在本发明中,所述YOLOv5网络模型的输出为(x,y,w,h,c),分别表示预测框在图像坐标系上的x、y坐标,矩形宽高width、height,以及置信度confidence。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京泓图人工智能技术研究院有限公司,未经南京泓图人工智能技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011547550.7/2.html,转载请声明来源钻瓜专利网。