[发明专利]基于支持向量机正则化路径的广义近似交叉验证方法无效

专利信息
申请号: 201010165610.9 申请日: 2010-05-07
公开(公告)号: CN101833693A 公开(公告)日: 2010-09-15
发明(设计)人: 廖士中;赵志辉;王梅 申请(专利权)人: 天津大学
主分类号: G06N99/00 分类号: G06N99/00
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 刘国威
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 支持 向量 正则 路径 广义 近似 交叉 验证 方法
【权利要求书】:

1.一种基于支持向量机正则化路径的广义近似交叉验证方法,其特征是,包括下列步骤:在定义的支持向量机正则化模型中,开始时赋给λ一个很大的值,让λ递减并趋向0,随着λ的减少,||β||增加,间隔的宽度减小,随着间隔的变窄,训练点从间隔里移到间隔外,与这些训练点对应的αi值从αi=1,此时训练点在间隔中,yif(xi)<1,变为αi=0,当它们移出间隔,yif(xi)>1,由连续性,当αi从1减至0时,训练点必会落到间隔yif(xi)=1上,然后,在得到的正则化路径上应用GACV方法,选出GACV值最小的分类器。

2.根据权利要求1所述的一种基于支持向量机正则化路径的广义近似交叉验证方法,其特征是,所述基于支持向量机正则化路径的广义近似交叉验证方法,进一步细化为:

第1步:初始化

(1)初始化情形1:n-=n+

对起始时值很大的λ,有其中

为满足式需一或多个正类和负类训练点同时击中拐点,随着λ的减少,有

iyif(xi)1]]>yi[β*Txiλ+β0]1---(18)]]>

β01-β*Txiλ]]>对所有i∈I+                                  (19)

β0-1-β*Txiλ]]>对所有i∈I-,                                (20)

取可以得到和得出求解初始输入点λ0和β0的方程,

λ0=β*Txi+-β*Txi-2---(21)]]>

β0=-(β*Txi++β*Txi-β*Txi+-β*Txi-)---(22)]]>

(2)初始化情形2:n+>n-

当β=0时,β0的最优值是1,损失为同样要求满足式引理对于设s.t.对i∈I+αi∈[0,1];对i∈I-,αi=1,且

则对某些λ0,有:对所有λ>λ0,且β=β*/λ,β*=Σi=1nyiαi*xi,]]>设β*对应于αi*的系数(17式):β*=Σi=1nαi*yixi---(25)]]>

因此存在下列两种可能的情形:

存在两个或多个元素在I+中,使得或者

αi*{0,1}iI+;]]>

对第一种情形,假设设则点i+将留在间隔中直到有I-中的点到达,由此

λ0=β*Txi+-β*Txi-2,---(26)]]>

这与(21)式是一致的,同样,β0与式(22)一致;

对第二种情形,易知来自I-中的点与I+中的点必须同时到达间隔,能得到类似的情形,只需换用记号I+1表示I+中满足的子集;

第2步:求解λl、αl、和fl

考虑下列事件:

1).初始化事件,2或多个训练点开始时处于拐点处,即它们对应的初值α∈[0,1],

2).训练点从L进入E中,初始值αi为1,

3).训练点从R进入E中,初始值αi为0,

4).一或多个训练点跳出集合E,进入R或L中,

无论出现哪种情况,出于连续性,集合在事件发生前保持稳定,若某点经过E,它对应的αi必定从0变成1或者从1变成0,E中的点满足yif(xi)=1,因而能建立αi的路径,

事件4)说明当L不空时E可能变为空,若L不空时E为空,则表明L中+1s与-1s平衡,下标l记录发生第l次事件后的集合,设|El|=m,且令αil,β0l和λl为该点在输入时参数值,类似的fl表示在该点处的函数值,为方便起见,令α0=λβ0,因而

f(x)=1λ(Σj=1nyjαjK(x,xj)+α0)---(27)]]>

若λl>λ>λl+1,则

f(x)=[f(x)-λlλfl(x)]+λlλfl(x)]]>

=1λ[ΣjEl(αj-αjl)yjK(x,xj)+(α0-α0l)+λlfl(x)]---(28)]]>

之所以能推出第二行,是因为Ll中观察值在λ的范围内满足αi=1,而在Rl中αi=0,对这m个训练点,xi∈El都处于拐点处,因而

1λ[ΣjEl(αj-αjl)yiyjK(xi,xj)+yi(α0-α0l)+λl]=1,iEl---(29)]]>

δj=αjl-αj,]]>由(28)有

[ΣjElδjyiyjK(xi,xj)+yiδ0=λl-λ,iEl---(30)]]>

此外,由于Σi=1nyiαi=0,]]>因而

ΣjElyiδj=0---(31)]]>

等式(30)和(31)对m+1个未知δj确定了m+1个方程,能求解;

对于El中的i和j,用m×m的矩阵Kl*表示训练点第ij次进入yiyjK(xi,xj),由(30)式有

kl*δ+δ0yl=(λl-λ)1,---(32)]]>

其中yl表示输入为yi的m维向量,i∈El,由(31)式有

ylTδ=0---(33)]]>

将两部分组合在一个矩阵里,

Al=0ylTylKl*,]]>δa=δ0δ,]]>1a=01,---(34)]]>

则(32)式与(33)式可写为

Alδa=(λl-λ)1a,                          (35)

若Al满秩,则可ba=Al-11a                     (36)

因而αj=αjl-(λl-λ)bj,j{0}UEl---(37)]]>

对于λl+1<λ<λl,拐点处的αj与λ满足线性关系,由(27)式,

f(x)=λlλ[fl(x)-hl(x)]+hl(x)---(38)]]>

其中hl(x)=ΣjElyjbjK(xi,xj)+b0---(39)]]>

若Al不满秩,则解路径上的某些αi值不唯一;

第3步:求解λl+1并更新

在下面的某个事件发生前,路径将停留在(37)-(38):

1).αi达到边界值(0或1),i∈El

2).Ll或Rl中的训练点达到yif(xi)=1,从(38)式知对点i,有

λ=λl(fl(xi)-hl(xi)yi-hl(xi))---(40)]]>

为检验这些条件,找出最大的λ<λl,当事件发生时,确立新的λl+1值并更新集合;

第4步:终止,

在可分的情形下,当L变为空时终止,此时,(17)式中的ξi全为零;

在不可分的情况下,λ取遍所有的可能值并最后变为零;

第5步:根据背景技术2中的结论,计算分类器中GACV值,取最小值者作为最优分类器,前面各式中,

X:输入训练点              y:训练点对应的类别

ξ:表示松弛变量          λ:正则项系数

β:表示正则项            β0:正则项初始值

αi,γi:拉格朗日乘子    f:表示学习器

A,B:表示类别            μ(f):对给定f的预测器。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010165610.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top