[发明专利]基于最小二乘支持向量机技术的偏向性分类及参数寻优方法有效
| 申请号: | 201310084937.7 | 申请日: | 2013-03-15 |
| 公开(公告)号: | CN103324939B | 公开(公告)日: | 2017-10-27 |
| 发明(设计)人: | 白瑞林;张振尧;吉峰 | 申请(专利权)人: | 江南大学;无锡信捷电气股份有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 214122 江苏省*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 最小 支持 向量 技术 偏向 分类 参数 方法 | ||
技术领域
本发明涉及机器视觉检测中的模式识别领域,具体是指一种通过最小二乘支持向量机技术实现对工业产品的偏向性分类及最小二乘支持向量机的参数寻优方法。
背景技术
机器视觉技术是计算机学科的一个重要分支,经过三十多年突发猛进的发展,凭借其速度快、精度高、永不疲劳的优点,在工业生产流水线上,逐步代替人工视觉检测,在降低人力成本的同时又可实现对产品质量的严格控制。
模式识别作为机器视觉的一个重要领域,一种分类准确率高,实时性能好的分类器对于产品合格率的控制起着至关重要的作用。实际生产中,应尽最大的可能性使得瑕疵产品不被分为合格产品,而在保证整体分类准确率的前提下允许小部分合格产品被分为瑕疵产品。贝叶斯分类器可以综合先验信息和样本信息,但是先验信息来源于经验或者以前的实验结论,没有确定的理论依据作支持;此外该方法处理数据复杂性高,时间和空间消耗较大,无法满足对实时性要求较高的场合。神经网络分类器存在一些不足之处,一方面它需要较长的训练时间,不适用于复杂的问题;另一方面可能陷入局部极小值解。而最小二乘支持向量机是基于统计学习理论的结构风险最小化原则和VC维理论,在得到全局最优解的同时具有非常好的推广能力。
在工业生产过程中,合格产品出现的概率远远大于瑕疵产品出现的概率,比较难以获得较多的瑕疵产品样本用于训练,或者合格产品与瑕疵产品的类分布差异较大,这两种情况可能导致在线分类时数量较少的瑕疵产品被错分为合格产品,致使合格产品混入瑕疵产品,影响了产品的整体质量。对多数类样本的欠采样学习和对少数类样本的过采样学习是从数据层面处理训练样本不均衡导致的分类偏斜问题的两种重要途径。虚拟少数类过采样算法避免了随机过抽样算法中由于盲目复制样本带来的过学习问题,但没有很好的考虑到孤立点样本、边界样本分布稀少对不平衡数据中少数类分类性能的影响。
最小二乘支持向量机的分类性能受到多种因素影响,其中惩罚参数和核函数类型及参数的选择对其性能影响较大。网格搜索法虽然能够找到在交叉验证意义下的最高分类正确率对应的最佳参数组合[gam,sig],但是计算时间复杂度大,算法效率相对较低。遗传算法和粒子群算法易陷入局部最优,或全局最优的计算量偏大。模拟退火算法理论上是具有概率的全局优化性能。耦合模拟退火算法在模拟退火算法的基础之上考虑到了通过能量耦合在一起的若干当前状态,具有并行性,在改进了最优参数的同时使得收敛速度不会下降,但往往需要经过很多次退火才能寻找到最优解,时间消耗较大。
发明内容
本发明的目的在于基于最小二乘支持向量机技术,设计一种带有偏向性、分类准确度高、适用于实时性要求较高场合的分类器。
为达此目的,本发明基于最小二乘支持向量机技术的偏向性分类和参数寻优的技术方案如下:该分类器基于最小二乘支持向量机技术;采用改进的虚拟少数类过采用算法,先使用K近邻算法(K取5)去除孤立样本点,再对边界样本点进行过采样,人工增加了瑕疵样本的数量,且使样本分布范围一定程度上向合格样本扩散,产生更适合于偏向性分类的训练样本数据;使用耦合模拟退火算法,进行两次退火,对最小二乘支持向量机核函数参数sig和惩罚参数gam进行初步寻优,在初步寻优所得参数组合的邻域,采用网格算法进行精细搜索;对比两次搜索得到的参数,确定最终的最优参数组合;整个流程包括去除孤立样本模块、虚拟少数类样本过采样模块、模拟退火算法模块、网格算法模块、参数对比模块。
优选实施例,去除孤立样本模块的输入为包含有合格样本和瑕疵样本的原训练数据,采用K近邻算法(K取5)计算每个样本xi的5个最近邻,如果5个最近邻的类别均与xi的类别不同,则删去xi,经过此模块处理,去除了原始训练样本数据中的孤立样本,并将结果输送到虚拟少数类样本过采样模块。
优选实施例,虚拟少数类样本过采样模块对每个瑕疵样本计算其5个最近邻,倘若其中有三个近邻属于合格样本,则判定该瑕疵样本为边界样本;对边界样本进行过采样,即在边界样本与其近邻的三个合格样本之间人工合成新的瑕疵样本,并加入到训练样本数据中,作为最小二乘支持向量机训练时的输入数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学;无锡信捷电气股份有限公司,未经江南大学;无锡信捷电气股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310084937.7/2.html,转载请声明来源钻瓜专利网。





