[发明专利]基于支持向量机正则化路径的广义近似交叉验证方法无效
申请号: | 201010165610.9 | 申请日: | 2010-05-07 |
公开(公告)号: | CN101833693A | 公开(公告)日: | 2010-09-15 |
发明(设计)人: | 廖士中;赵志辉;王梅 | 申请(专利权)人: | 天津大学 |
主分类号: | G06N99/00 | 分类号: | G06N99/00 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 刘国威 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 支持 向量 正则 路径 广义 近似 交叉 验证 方法 | ||
1.一种基于支持向量机正则化路径的广义近似交叉验证方法,其特征是,包括下列步骤:在定义的支持向量机正则化模型中,开始时赋给λ一个很大的值,让λ递减并趋向0,随着λ的减少,||β||增加,间隔的宽度减小,随着间隔的变窄,训练点从间隔里移到间隔外,与这些训练点对应的αi值从αi=1,此时训练点在间隔中,yif(xi)<1,变为αi=0,当它们移出间隔,yif(xi)>1,由连续性,当αi从1减至0时,训练点必会落到间隔yif(xi)=1上,然后,在得到的正则化路径上应用GACV方法,选出GACV值最小的分类器。
2.根据权利要求1所述的一种基于支持向量机正则化路径的广义近似交叉验证方法,其特征是,所述基于支持向量机正则化路径的广义近似交叉验证方法,进一步细化为:
第1步:初始化
(1)初始化情形1:n-=n+
对起始时值很大的λ,有其中
为满足式需一或多个正类和负类训练点同时击中拐点,随着λ的减少,有
或
取可以得到和得出求解初始输入点λ0和β0的方程,
(2)初始化情形2:n+>n-
当β=0时,β0的最优值是1,损失为同样要求满足式引理对于设s.t.对i∈I+αi∈[0,1];对i∈I-,αi=1,且
则对某些λ0,有:对所有λ>λ0,且β=β*/λ,
因此存在下列两种可能的情形:
存在两个或多个元素在I+中,使得或者
对第一种情形,假设设则点i+将留在间隔中直到有I-中的点到达,由此
这与(21)式是一致的,同样,β0与式(22)一致;
对第二种情形,易知来自I-中的点与I+中的点必须同时到达间隔,能得到类似的情形,只需换用记号I+1表示I+中满足的子集;
第2步:求解λl、αl、和fl:
考虑下列事件:
1).初始化事件,2或多个训练点开始时处于拐点处,即它们对应的初值α∈[0,1],
2).训练点从L进入E中,初始值αi为1,
3).训练点从R进入E中,初始值αi为0,
4).一或多个训练点跳出集合E,进入R或L中,
无论出现哪种情况,出于连续性,集合在事件发生前保持稳定,若某点经过E,它对应的αi必定从0变成1或者从1变成0,E中的点满足yif(xi)=1,因而能建立αi的路径,
事件4)说明当L不空时E可能变为空,若L不空时E为空,则表明L中+1s与-1s平衡,下标l记录发生第l次事件后的集合,设|El|=m,且令αil,β0l和λl为该点在输入时参数值,类似的fl表示在该点处的函数值,为方便起见,令α0=λβ0,因而
若λl>λ>λl+1,则
之所以能推出第二行,是因为Ll中观察值在λ的范围内满足αi=1,而在Rl中αi=0,对这m个训练点,xi∈El都处于拐点处,因而
记
此外,由于
等式(30)和(31)对m+1个未知δj确定了m+1个方程,能求解;
对于El中的i和j,用m×m的矩阵Kl*表示训练点第ij次进入yiyjK(xi,xj),由(30)式有
其中yl表示输入为yi的m维向量,i∈El,由(31)式有
将两部分组合在一个矩阵里,
则(32)式与(33)式可写为
Alδa=(λl-λ)1a, (35)
若Al满秩,则可ba=Al-11a (36)
因而
对于λl+1<λ<λl,拐点处的αj与λ满足线性关系,由(27)式,
其中
若Al不满秩,则解路径上的某些αi值不唯一;
第3步:求解λl+1并更新
在下面的某个事件发生前,路径将停留在(37)-(38):
1).αi达到边界值(0或1),i∈El,
2).Ll或Rl中的训练点达到yif(xi)=1,从(38)式知对点i,有
为检验这些条件,找出最大的λ<λl,当事件发生时,确立新的λl+1值并更新集合;
第4步:终止,
在可分的情形下,当L变为空时终止,此时,(17)式中的ξi全为零;
在不可分的情况下,λ取遍所有的可能值并最后变为零;
第5步:根据背景技术2中的结论,计算分类器中GACV值,取最小值者作为最优分类器,前面各式中,
X:输入训练点 y:训练点对应的类别
ξ:表示松弛变量 λ:正则项系数
β:表示正则项 β0:正则项初始值
αi,γi:拉格朗日乘子 f:表示学习器
A,B:表示类别 μ(f):对给定f的预测器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010165610.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电连接插套
- 下一篇:一种口腔微生物群落数据库及其应用