[发明专利]一种基于机器学习算法进行图像分析的方法在审

申请号：	201710576650.4	申请日：	2017-07-14
公开（公告）号：	CN107358264A	公开（公告）日：	2017-11-17
发明（设计）人：	夏春秋	申请（专利权）人：	深圳市唯特视科技有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/08
代理公司：	暂无信息	代理人：	暂无信息
地址：	518057 广东省深圳市高新技术产业园***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于机器学习算法进行图像分析方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及图像分析领域，尤其是涉及了一种基于机器学习算法进行图像分析的方法。

背景技术

图像分析常用于工业、检测、遥感、军事等领域，一般利用数学模型并结合图像处理的技术来分析底层特征和上层结构，从而提取具有一定智能性的信息。具体地，在工业领域，多用于工业自动化，如机器手抓取物体，自动操纵线焊机和切削刀具，对于油井现场或地震资料的大量数据进行监测和筛选，对自动装配和修理提供视觉反馈。在检测领域，图像分析可以检查印刷电路板上的尖角、短路和联接不良，检验铸件中的杂质和裂缝，筛选医学图像和断层图像，常规筛选工厂产品。在遥感领域，可以应用于制图学、交通监控、资源管理、矿物勘探。在军事领域，可用于跟踪运动物体、自动导航、目标搜索和测距等。虽然图像分析的研究已经取得不少成果，并在许多领域的具体对象上得到实际应用，但无监督聚类法在粒度识别上还有一定局限性。

本发明提出了一种基于机器学习算法进行图像分析的方法，根据分级器对数据集的深度学习给出图像中物品的属性特征。使用监督学习法，训练机器对图片注释进行学习，建立物品属性分类器，最大限度的提高测试性能标准，机器进行分类，再把其运用到更大的数据库，使其成为图片分析的有效工具，本发明使用两个新型视觉算法，通过图像聚类来检测相关属性集群，根据已识别的属性集群，进一步识别图片和物品集群，根据机器学习给出物品属性，为工业领域的新设计，以及工程领域的创新解决方案做了进一步贡献。

发明内容

针对图像分析，提出两个新型视觉算法，通过图像聚类来检测相关属性集群，根据已识别的属性集群，进一步识别图片和物品集群，根据机器学习给出物品属性，为工业领域的新设计，以及工程领域的创新解决方案做了进一步贡献。

为解决上述问题，本发明提供一种基于机器学习算法进行图像分析的方法，其主要内容包括：

(一)属性学习；

(二)按尺度计量属性；

(三)集群方式的一致可视化。

其中，所述的属性学习，其特征在于监督学习法，训练机器对图片注释进行学习，分析新图像里面的物品属性，其中创建卷积神经网络(CNN)的关键是网络结构和内影像图层，CNN次末级输出一个典型的特征向量，其维度为1024，其中由线性层输出预测评分，如所出现物品属性的概率，CNN在基于ImageNet数据集的基础上学习图像分类，对CNN进行数据上的调整，根据无监督聚类法，可以自动检测可视化相关数据，计算出图像的物品属性。

进一步地，所述的在ImageNet数据集的基础上学习图像分类，其特征在于，在ImageNet学习之后，不考虑网络的最后一个线性层，其输出维度是1024，平行追加几个1024×N_i线性层，其中i类属性标签数量为N_i，其中在每张图像上运行两个新型视觉算法，一个负责检测和定位物品，另一个负责估算图像其余部分的可见性，在图像中给定一组物品图像以及其余可见部分，用基于距离的启发式算法对二者进行配对，根据检测到的物品位置和规模，计算出一个典型图像，其中超出包围盒的图像不检测。

进一步地，所述的属性标签，每个属性，先采用分层抽样法选择一个属性标签，其次为该属性标签指定一个具体的图像，其中分层抽样法抵消了每个属性的隐形失衡，经过32次抽样后，建立一个小批量图集，通过CNN计算迷你图集相对于交叉熵误差的参数梯度，每个属性积累到一定梯度后，令梯度下降动量＝0.9，学习率＝10^-2，重量衰变＝10^-4，以此来更新CNN的参数，其中选取图像的属性注释组成新子集(SS)，其中已注释数据集包含大量图像，每个图像具有12种物品属性，其80％的SS负责培训，10％负责确认停止训练的时间以及进一步分析此部分，10％负责把测试出的属性分类并做出最终评价。

进一步的，所述的SS，根据数据集里的每张图片提取出的物品信息，把物品属性相关的注释组成一个子集，运用机器学习其属性和分类，其学习结果推广运用到整个数据集，其中物品属性包括：物品种类，用途，颜色等。

进一步地，所述的按尺度计量属性，其特征在于，建立物品属性分类器，最大限度的提高测试性能标准，机器进行分类，再把其运用到更大的数据库，使其成为图片搜索的有效工具，结果表明，根据图像中物品属性对应正确率小于50％，分类器预测该图像为NO的时候占99％，对于其存在的误差，使用后验概率模型校准分类器评分，校准方法包括分类器概率输出和保序回归。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司，未经深圳市唯特视科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710576650.4/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于机器学习算法进行图像分析的方法在审

专利文献下载