[发明专利]基于度量学习的菜品识别方法及装置有效
申请号: | 202010070065.9 | 申请日: | 2020-01-21 |
公开(公告)号: | CN111274972B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 常德杰;孔飞;刘邦长;李荣华;姜鹏;刘朝振;刘红霞;张航飞;季科 | 申请(专利权)人: | 北京妙医佳健康科技集团有限公司 |
主分类号: | G06V20/68 | 分类号: | G06V20/68;G06V10/764;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 安卫静 |
地址: | 100000 北京市朝阳区西大*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 度量 学习 菜品 识别 方法 装置 | ||
本发明提供了一种基于度量学习的菜品识别方法及装置,涉及图像识别和处理的技术领域,包括:先获取待检测图像;若待检测图像为菜品图像,则对待检测图像进行裁剪,得到包含菜品信息的目标图像;然后将目标图像输入至目标卷积神经网络中,得到目标图像的特征信息;目标卷积神经网络为基于度量学习训练的网络;再利用最近邻方法从预设数据库中选择与目标图像的特征信息相似的图像特征信息;最后将图像特征信息对应的菜品信息作为待检测图像的菜品信息。本发明基于度量学习训练好的卷积神经网络模型对菜品图像的识别粒度小,进而可以区分特征相似的菜品。度量学习还可以通过优化特征空间,实现对类内距离大的菜品图像的识别。
技术领域
本发明涉及图像识别和处理技术领域,尤其是涉及一种基于度量学习的菜品识别方法及装置。
背景技术
目前卷积神经网络已经应用于菜品识别中,但是传统的卷积神经网络对类内距离大的菜品图像无法进行类别聚类,对类间距离较小的菜品图像无法进行区分,例如:无法将煮好的面条和包装袋内的面条认定为同一类别,无法区分清蒸鱼和红烧鱼。
发明内容
本发明的目的在于提供一种基于度量学习的菜品识别方法及装置,可以保证对菜品图像的识别粒度小,进而可以区分特征相似的菜品;可以最小化类内距离,进而实现对类内距离大的菜品图像的有效识别。
本发明提供的一种基于度量学习的菜品识别方法,其中,包括:获取待检测图像;若所述待检测图像为菜品图像,则对所述待检测图像进行裁剪,得到包含菜品信息的目标图像;将所述目标图像输入至目标卷积神经网络中,得到所述目标图像的特征信息;所述目标卷积神经网络为基于度量学习训练的网络;利用最近邻方法从预设数据库中选择与所述目标图像的特征信息相似的图像特征信息;将所述图像特征信息对应的菜品信息作为待检测图像的菜品信息。
进一步的,通过以下方式判断所述待检测图像是否为菜品图像,具体包括:利用训练好的二分类模型对所述待检测图像进行二分类判断,得到类别判断结果;基于所述类别判断结果判断所述待检测图像是否为菜品图像。
进一步的,在利用训练好的二分类模型对所述待检测图像进行二分类判断之前,包括:训练初始二分类模型,得到所述训练好的二分类模型。
进一步的,训练初始二分类模型,得到所述训练好的二分类模型包括:获取二分类训练样本;基于所述二分类训练样本,利用交叉熵损失函数优化所述初始二分类模型的参数,确定最优参数;将最优参数的初始二分类模型确定为所述训练好的二分类模型。
进一步的,在将所述目标图像输入至目标卷积神经网络中,得到所述目标图像的特征信息之前,包括:利用度量学习中的损失函数Triplet Loss训练初始卷积神经网络,得到所述目标卷积神经网络。
进一步的,利用度量学习中的损失函数Triplet Loss训练初始卷积神经网络,得到所述目标卷积神经网络包括:获取菜品图像训练样本,其中,所述菜品图像训练样本满足预设尺寸规格;将所述菜品图像训练样本输入至初始卷积神经网络中,以根据所述卷积神经网络提取菜品图像的特征信息;基于所述菜品图像的特征信息和度量学习的损失函数Triplet Loss,计算所述损失函数的函数值;将所述函数值最小时对应的初始卷积神经网络确定为所述目标卷积神经网络。
本发明提供的一种基于度量学习的菜品识别装置,其中,包括:获取模块,用于获取待检测图像;裁剪模块,用于若所述待检测图像为菜品图像,则对所述待检测图像进行裁剪,得到包含菜品信息的目标图像;输入模块,用于将所述目标图像输入至目标卷积神经网络中,得到所述目标图像的特征信息;所述目标卷积神经网络为基于度量学习训练的网络;选择模块,用于利用最近邻方法从预设数据库中选择与所述目标图像的特征信息相似的图像特征信息;确定模块,用于将所述图像特征信息对应的菜品信息作为待检测图像的菜品信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京妙医佳健康科技集团有限公司,未经北京妙医佳健康科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010070065.9/2.html,转载请声明来源钻瓜专利网。