[发明专利]一种支持向量回归机模型选择方法在审
申请号: | 201610403137.0 | 申请日: | 2016-06-07 |
公开(公告)号: | CN106096646A | 公开(公告)日: | 2016-11-09 |
发明(设计)人: | 王海伦;许大星;柴国飞;黄钢 | 申请(专利权)人: | 衢州学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 324000 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种支持向量回归机模型选择方法,针对支持向量回归机的模型选择问题提出了一种新的基于混合核函数和容积卡尔曼滤波的支持向量回归机模型选择方法。选择混合核函数作为支持向量机的核函数,把混合核函数的组合系数嵌入到核函数参数与回归参数组成的超参数状态向量当中,从而将模型选择问题转换成一个非线性系统的状态估计问题,然后基于高性能的容积卡尔曼滤波进行超参数估计。仿真实验表明,本文所提方法与单个核函数的容积卡尔曼滤波支持向量回归机模型选择方法、遗传算法相比,该方法得到的决策回归函数具有更大的泛化能力,预测精度更高。 | ||
搜索关键词: | 一种 支持 向量 回归 模型 选择 方法 | ||
【主权项】:
一种支持向量回归机模型选择方法,其特征在于:包括参数滤波估计模型的建立、系统设计、预测输出函数、容积卡尔曼滤波、MKF‑CKF‑SVR模型参数选择;参数滤波估计模型的建立:建立如下超参数非线性系统γ(k)=γ(k‑1)+w(k) (1)y(k)=h(γ(k))+v(k) (2)其中,γ(k)是超参数状态向量,y(k)是观测输出,过程噪声w(k)和观测噪声v(k)均是均值为零的高斯白噪声,且方差分别为Q和R;由于待求的最优超参数可以看做是固定不变的,所以可以建立式(1)所示的关于超参数的线性状态方程,其次对于任何一个状态向量γ(k),经过LIBSVM训练预测之后每一个原始数据都有一个预测输出,故可建立式(2)所示的非线性观测方程;为了CKF算法的运行,需要对系统模型加入人工过程白噪声和观测白噪声;系统设计:支持向量回归机:支持向量回归机的最终目的是找到一个回归函数f:RD→R,使得y=f(x)=wTφ(x)+b (3)其中,φ(x)是一个将数据x从低维映射到高维特征空间的函数;w是一个权重向量,并且b是一个上下平移的数值;标准支持向量回归机采用ε‑不灵敏函数,假设所有训练数据在精度ε下用线性函数拟合;这时,把问题转化为求优化目标函数最小化问题:
式中,ξi,
是松弛因子,当拟合有误差时,ξi,
都大于0,误差不存在时为0,优化函数第一项使拟合函数更为平坦,从而提高泛化能力;第二项为减小误差;常数C>0表示对超出误差ε的样本的惩罚程度;将核函数组合系数p1,p2、局部核函数的参数、全局核函数的参数以及惩罚参数C作为支持向量回归机的超参数γ,令k1为局部核函数的核参数向量,k2为全局核函数的核参数向量,则模型(1)中的超参数状态向量γ=[p1,p2,k1,k2,C]T;求解(4)式的凸二次优化问题,引入Lagrange乘子αi,
支持向量回归机的原始问题(4)转换成如下对偶形式:
通过求解该对偶问题得到原始问题的解
从而构造决策函数;将核函数K(x,x')代替目标函数(1)中的內积(xi·xj),则得到决策函数为:
其中,
按如下方式计算:选择开区间中的
或
若选到的是
则
若选到的是
则
预测输出函数:假设支持向量回归机的原始样本数据集合为D={(xi,yi)|i∈I},其中指标集合I={1,2,...,N},yi为数据的目标向量,运用k‑折交叉验证方法将样本数据分成k组,即Dj={(xi,yi)|i∈Ij} (9)其中j∈{1,2,...,k},并且所有组的指标集Ij满足I1∪Ij∪…∪Ik=I,所有组的数据集Dj满足D1∪D2∪…∪Dk=D;在每一次支持向量回归的迭代运算中,使用其中任意一组数据Dp用作预测,剩下的k‑1组数据作为训练数据库,给定初始的超参数γ0利用LIBSVM[25]训练支持向量回归机;设此时训练结果为
和
则此时的决策函数为:
其中,
将数据组Dp代入式(11),即可得到Dp的预测输出值
分别将数据组Di,i∈{1,2,...,k}作为预测数据组,其余的数据组D1,...,Di‑1,Di+1,...,Dk作为支持向量回归机训练数据组,经过k‑折交叉验证回归预测之后,样本数据集D中的每一个数据有且仅有一个预测输出值;故对于超参数向量γ,可定义如下预测输出函数:y=h(γ) (12)其中,y=(y(1),y(2),...,y(N))T;容积卡尔曼滤波:基于公式(1)、(2)所建立的超参数模型以及预测输出函数(12),下面给出容积卡尔曼滤波算法部分的主要步骤,包括2个过程,即时间更新过程和测量更新过程:时间更新:1)假设在k时刻状态误差协方差矩阵已知,按下式分解P(k‑1|k‑1)=S(k‑1|k‑1)ST(k‑1|k‑1) (13)2)按下式计算容积点(i=1,2,…,m)![]()
其中,m=2nx,
如若状态维数为2,则[1]∈R2,表示集合点
且[1]i表示该集合中的第i个向量点;3)计算传播容积点(i=1,2,…,m)![]()
4)计算一步状态预测![]()
5)一步预测误差协方差阵为![]()
测量更新1)按下式分解一步预测误差协方差阵P(k|k‑1)=S(k|k‑1)ST(k|k‑1) (18)2)计算容积点(i=1,2,…,m)![]()
3)基于预测输出函数(14)‑(17)计算传播容积点Yi(k|k‑1)=h(Xi(k|k‑1)) (20)4)一步测量预测为![]()
5)新息协方差矩阵为![]()
6)计算互协方差矩阵![]()
7)计算增益矩阵![]()
8)更新估计状态![]()
9)状态误差协方差矩阵为P(k|k)=P(k|k‑1)‑K(k)Pyy(k|k‑1)KT(k) (31)Remark 2:由于CKF算法运用了径向积分和球形积分方法,该算法本身比UKF算法具有更高的估计精度;从容积卡尔曼滤波算法对超参数的估计过程来看,主要是在测量更新步骤(20)式中,需要将LIBSVM训练得到的预测输出函数嵌入到传播容积点的计算当中;MKF‑CKF‑SVR模型参数选择在超参数系统(1)‑(2)中,观测向量y(k)的真实值在每一次迭代中都是不变的,且就是原始样本数据的目标值向量y(k)=(y1,y2,...,yN)T,故可根据观测向量的真实值y(k)及预测输出值
对超参数状态向量γ做最优状态估计,使得真实值与预测输出值的方差达到最小;MKF‑CKF‑SVR算法同样是包括两个过程,即时间更新过程和测量更新过程:时间更新:由于该更新过程是对状态的预测更新,且状态方程是线性已知的,故可根据容积卡尔曼滤波算法的时间跟新过程进行MKF‑CKF‑SVR算法的时间更新;测量更新:在测量更新的过程中需要用到预测输出函数,故不能直接利用CKF算法的公式(17)进行传播容积点的计算;需要由超参数状态向量γ(k),利用LIBSVM训练数据集,再预测输出
具体的MKF‑CKF‑SVR算法步骤:初始化:1.1获得原始数据集D,选择混合核函数模型,将组合系数嵌入到超参数状态向量γ当中,设置初始超参数状态值γ0;1.2运用k折交叉验证法首先将原始数据集分成k组D1,D2,…,DkWhile(超参数状态值不满足设定条件)do;时间更新:1.3利用公式(12)‑(17)对超参数状态进行时间更新测量更新:1.4根据公式(17)分解一步预测误差协方差阵1.5由用公式(18)计算容积点1.6轮流将k组数据中的一组作为测试集,其它k‑1组作为训练集,基于LIBSVM算法对数据集进行训练,最后预测输出
1.7基于预测
利用公式(21)计算一步测量预测1.8运用公式(21)‑(25)继续进行测量更新End whileEndRemark3:基于混合核函数和容积卡尔曼滤波算法的SVR算法将混合核函数的组合系数与核参数及惩罚参数C作为超参数状态向量,然后利用k‑折交叉验证法基于LIBSVM对数据集进行预测输出,最终用CKF算法迭代计算最优的的超参数状态向量;实际上,整个MKF‑CKF‑SVR算法的过程就是在迭代寻找最优的状态向量γ,使得样本真实目标值y(k)与支持向量回归机的预测输出
之间的误差方差最小。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于衢州学院,未经衢州学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610403137.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种木质地板板材加工工艺
- 下一篇:搜索网络方法及无线终端