[发明专利]识别产品图像的方法和装置、存储介质在审
申请号: | 201910407628.6 | 申请日: | 2019-05-16 |
公开(公告)号: | CN110119749A | 公开(公告)日: | 2019-08-13 |
发明(设计)人: | 庞芸萍 | 申请(专利权)人: | 北京小米智能科技有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 曾尧 |
地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 产品图像 预处理 卷积神经网络 方法和装置 存储介质 局部特征描述 模型识别 输出识别 图像识别 描述子 预设 聚合 图像 | ||
本公开涉及一种识别产品图像的方法和装置、存储介质,用于解决相关技术中图像识别过程中对图像的局部特征描述能力较弱的技术问题。所述识别产品图像的方法包括:获取产品图像;对所述产品图像进行预处理;基于预设的卷积神经网络模型识别预处理后的所述产品图像,并输出识别结果;其中,所述卷积神经网络模型的结构中设有可微分的局部聚合描述子。
技术领域
本公开涉及图像识别技术领域,具体地,涉及一种识别产品图像的方法和装置、存储介质。
背景技术
利用人工手段进行产品识别的方法耗时耗力,不利于工业化应用,通过拍摄产品的图像进行机器识别可以解决该问题,目前图片识别基本都采用卷积神经网络(Constitutional Neural Networks,CNN)。卷积神经网络是在多层神经网络的基础上发展起来的针对图像分类和识别而特别设计的一种深度学习方法。卷积神经网络使用了针对图像识别的特殊结构,可以快速训练。
发明内容
本公开提供一种识别产品图像的方法和装置、存储介质,以解决相关技术中图像识别过程中对图像的局部特征描述能力较弱的技术问题。
为实现上述目的,本公开实施例的第一方面,提供一种识别产品图像的方法,所述方法包括:
获取产品图像;
对所述产品图像进行预处理;
基于预设的卷积神经网络模型识别预处理后的所述产品图像,并输出识别结果;其中,所述卷积神经网络模型的结构中设有可微分的局部聚合描述子。
可选地,还包括:
构建卷积神经网络的网络架构,所述架构包括依次连接的卷积层、池化层、全连接层和分类器层;其中,所述全连接层中设有可微分的局部聚合描述子;
根据采集获得的产品图像样本集对构建的卷积神经网络进行训练,获得训练完毕的卷积神经网络模型。
可选地,所述可微分的局部聚合描述子的计算方式为:
其中,给定N个D维度的局部图像描述子,所述Xi表示第i个局部图像描述子,V(j,k)表示图像特征在(j,k)位置的元素值;所述xi(j)表示图像描述子Xi的第j维元素,ck(j)表示第k个单词中心的第j维元素;ak(Xi)为可微分的示性函数,取值范围在[0,1]之间,表示Xi之于单词中心ck的隶属度。
可选地,ak(Xi)的计算方式为:
其中,Wk=2αck,bk=-α||ck||2,α是用来控制ak(Xi)对距离大小的衰减程度,当α趋于正无穷时,ak(Xi)对距离最近的单词中心的取值为1。
本公开实施例的第二方面,提供一种识别产品图像的装置,所述装置包括:
获取模块,被配置为获取产品图像;
预处理模块,被配置为对所述产品图像进行预处理;
识别模块,被配置为基于预设的卷积神经网络模型识别预处理后的所述产品图像,并输出识别结果;其中,所述卷积神经网络模型的结构中设有可微分的局部聚合描述子。
可选地,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米智能科技有限公司,未经北京小米智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910407628.6/2.html,转载请声明来源钻瓜专利网。