[发明专利]基于迭代均值聚类的深度样本学习方法有效

申请号：	201810558766.X	申请日：	2018-06-01
公开（公告）号：	CN108877947B	公开（公告）日：	2021-10-15
发明（设计）人：	李勇明;郑源林;王品;颜芳;张成;李新科	申请（专利权）人：	重庆大学
主分类号：	G16H50/70	分类号：	G16H50/70;G06K9/62
代理公司：	重庆敏创专利代理事务所(普通合伙) 50253	代理人：	陈千
地址：	400044 ***	国省代码：	重庆;50
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于均值深度样本学习方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于迭代均值聚类的深度样本学习方法，按照以下步骤进行：S1：选择训练数据，并通过N次迭代均值聚类算法处理得到N+1层训练样本子集，N≥1；S2：将每层训练样本子集独立进行回归训练，得到N+1个回归器；S3：选择验证数据，并将验证数据分别送入N+1个回归器中得到N+1个验证结果；S4：基于加权融合机制确定每个回归器对应的最佳权重(w₀,w₁,…,w_N)；S5：获取测试数据，并利用N+1个回归器以及对应的最佳权重得到最终的预测结果。其效果是：将学习样本经过多次迭代均值聚类得到不同的训练样本数据集，然后分别进行训练和学习，在相同样本数量的情况下，有效增加了模型的学习能力，提升了分类或预测的准确性。

技术领域

本发明涉及人工智能技术，具体涉及到一种基于迭代均值聚类的深度样本学习方法。

背景技术

随着人工智能技术的发展，样本学习的方式也多种多样，样本学习方法的好坏严重影响着后续分类和回归的准确性。

现有技术中的人工智能算法，大多数采用单一的样本数据集进行学习和训练，一方面，由于能够直接获取的学习样本数量有限，仅靠增加迭代次数来增强分类器或回归器的性能，效果有限；另一方面，现有学习样本的真伪程度也会对训练模型的性能产生严重的影响，如果将所有的学习样本同等的对待，难以避免伪样本对模型性能造成影响。

为了避免伪样本的影响，也有人提出在线学习机制，如中国专利201010166225.6公开的一种基于在线学习的自适应级联分类器训练方法，首先采用少量样本训练初始级联分类器，然后将该分类器用于图像中的目标检测，由于训练样本较少，该分类器初始检测效果不好。但是，通过跟踪自动提取在线学习样本，采用自适应级联分类器算法对初始级联分类器进行在线学习，从而可以逐步提高该分类器在图像中进行目标检测的精度。并且通过跟踪使分类器在线学习的新样本可以自动获取并且自动标注，提高了分类器训练过程的智能化程度，大大减轻了人工标注样本类别的工作量。

但是，通过在线学习这种机制，需要逐步的提取新的学习样本，增加了算法复杂度，而且算法性能的提升需要一个相对漫长的过程，初期性能相对较差。

发明内容

为了解决上述问题，本发明提供一种基于迭代均值聚类的深度样本学习方法，在分类器或回归器的学习过程中，通过迭代均值聚类将原始样本分类为多个层次，每一层单独训练一个分类器或回归器，然后通过验证数据集分别进行验证，得到各个回归器的权重，从而确保最大化的学习和利用样本数据中的特性，提升模式识别或分类的准确性。

为实现上述目的，本发明所采用的具体技术方案如下：

一种基于迭代均值聚类的深度样本学习方法，其关键在于按照以下步骤进行：

S1：选择训练数据，并通过N次迭代均值聚类算法处理得到N+1层训练样本子集，N≥1；

S2：将每层训练样本子集独立进行回归训练，得到N+1个回归器；

S3：选择验证数据，先将验证样本与每一层的样本空间进行欧氏距离相似性计算，从而将该验证样本转化为该层样本空间与之最相似的样本，并将这些样本分别送入N+1个回归器中得到N+1个验证结果；

S4：基于加权融合机制确定每个回归器对应的最佳权重(w₀,w₁,…,w_N)；

S5：获取测试数据，先将测试样本与每一层的样本空间进行欧氏距离相似性计算，从而将该测试样本转化为该层样本空间与之最相似的样本，再将这些样本分别送入步骤S2所得的N+1个回归器以及步骤S4所得的每个回归器对应的最佳权重得到最终的预测结果。

进一步地，确定最佳权重(w₀,w₁,…,w_N)时的约束条件为：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于重庆大学，未经重庆大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810558766.X/2.html，转载请声明来源钻瓜专利网。