[发明专利]一种基于Ransac算法的鲁棒AdaBoost分类器构建方法在审
申请号: | 201711353247.1 | 申请日: | 2017-12-15 |
公开(公告)号: | CN108090512A | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 罗宇;黄文超;吴家慧;李文琪 | 申请(专利权)人: | 佛山市厚德众创科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 佛山帮专知识产权代理事务所(普通合伙) 44387 | 代理人: | 颜春艳 |
地址: | 528200 广东省佛山市南海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类器模型 构建 构建分类器 鲁棒 迭代过程 分类模型 强分类器 训练样本 样本建立 样本子集 分类 抽取 样本 重复 | ||
本发明提出了一种基于Ransac算法的鲁棒AdaBoost分类器构建方法,包括以下步骤:根据Ransac算法,构建立样本子集;抽取样本;利用AdaBoost算法训练强分类器;计算分类模型对应分类精度;构建分类器模型Ci;判断满足该新构建分类器模型的全部训练样本;重复上述步骤,直到基于Ransac算法估计下的一个模型Ci和其对应的一致集;判断已建立的不同分类器模型数量是否已超过Nmax;确定为最终选取的分类器模型,计算对应分类精度。本发明构建方法由含有外点的样本建立了最佳的分类器模型,并且利用Ransac算法的迭代过程去除了外点对分类器模型构建的影响。
技术领域
本发明涉及鲁棒分类器技术领域,具体涉及一种基于Ransac算法的鲁棒AdaBoost分类器构建方法。
背景技术
AdaBoost一词是来源于Adaptive Boosting(自适应增强)的缩写,是由YoavFreund和Robert Schapire提出的机器学习元算法,它的设计指导原则是确保当前训练样本有最高分类精度。通过将不同的弱分类器(这里所谓的弱分类器是指分类精度稍稍好于随机猜测)合理的组合起来,形成强分类器,尽管每个弱分类器的分类精度不高,但最终的强分类器在分类性能上会得到巨大提升。AdaBoost算法在某种意义上讲是自适应的,通过调整之前被弱分类器错分样本的权值,提高后续弱分类器对错分样本的重视程度,实现最终分类器模型的设计。正是基于此,合理的设计一组弱分类器,可以组合成强分类器,获得一个整体上令人满意的分类精度。但是,像任何事情都具有两面性一样,尽管AdaBoost算法优点众多,但其对外点敏感,在一些情况下更容易受此影响而导致分类器整体性能的降级、失效。这是因为不断对不能正确分类的样本进行加权,尤其是对外点的不断加权,使得外点的权值过快增长。过大的外点权值会引起分类器算法不断向外点偏离,进而背离大部分正常样本,不可避免的会造成所设计分类器模型的降级。
发明内容
针对现有技术的不足,本发明提出一种基于Ransac算法的鲁棒AdaBoost分类器构建方法,去除潜在外点。
本发明的技术方案是这样实现的:一种基于Ransac算法的鲁棒AdaBoost分类器构建方法,包括以下步骤:
(1)根据Ransac算法,设置每次初始构建分类器的样本子集为R,样本个数为n;
(2)从训练样本集中随机抽取n个样本,作为样本子集R;
(3)基于这些样本,利用AdaBoost算法训练强分类器,使得分类器模型最符合当前样本;
(4)基于AdaBoost算法用新构建的分类器模型Ci分类剩余的样本,并计算分类模型对应分类精度;
(5)用所有这些正确的样本重新基AdaBoost算法构建分类器模型Ci;
(6)用这个新构建的分类器模型再次判断满足该新构建分类器模型的全部训练样本,即样本子集为R的一致集,并更新当前迭代次数j=j+1;
(7)重复上述步骤4到步骤6直到满足分类器模型Ci的样本数量m不再增加或迭代次数已经超过了Tmax,则这m个样本构成内点集,重新训练分类器模型,至此可以获得基于Ransac算法估计下的一个模型Ci和其对应的一致集;
(8)更新i=i+1,判断已建立的不同分类器模型数量是否已超过Nmax,如未超过转回步骤(2);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山市厚德众创科技有限公司,未经佛山市厚德众创科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711353247.1/2.html,转载请声明来源钻瓜专利网。