[发明专利]基于跨维马尔科链蒙特卡罗的自适应多项式回归方法在审
申请号: | 201910514947.7 | 申请日: | 2019-06-14 |
公开(公告)号: | CN110334320A | 公开(公告)日: | 2019-10-15 |
发明(设计)人: | 陈亚军;贺鹏;康晓兵;赵嘉蕊 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06F17/18 | 分类号: | G06F17/18 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 杨洲 |
地址: | 710048*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多项式回归 自适应 马尔科夫链 多项式系数 参数更新 参数状态 已知数据 贝叶斯 鲁棒性 图模型 变维 推理 寻优 回归 死亡 联合 | ||
1.基于跨维马尔科夫链蒙特卡罗的自适应多项式回归方法,其特征在于,包括以下步骤:
首先,建立含有多项式阶次和多项式系数参数的图模型,即建立包含多项式阶次和多项式系数的贝叶斯模型;
然后,针对多项式回归问题,提出出生和死亡两种跨维的参数状态转移策略及一个不变维的参数更新策略;而后,基于跨维马尔科夫链蒙特卡罗方法,基于给定数据样本,实现多项式回归模型阶次和多项式系数的联合寻优;
具体的跨维转移核策略是:多项式阶次变高,对应出生过程,模型变为M+1阶,新生成第M+1阶的多项式系数;多项式模型阶次变低,对应死亡过程,多项式模型由M阶变为M-1阶,此时多项式其他系数不变。
2.如权利要求1所述的基于跨维马尔科夫链蒙特卡罗的自适应多项式回归方法,其特征在于,包括以下步骤:
步骤1,建立有向无环概率图模型,用于对多项式回归问题中多项式系数向量a和方差σ2等未知参数后验推理的贝叶斯模型描述;
步骤2,提出出生和死亡两种跨维的参数状态转移策略及一个不变维的参数更新策略;具体如下:
1)出生过程
多项式的回归问题中,设计的出生过程是指多项式的阶次增加1的过程,即相对于原有的M阶多项式,多出生一个高阶项xM+1,因此,多项式的阶次由M变为M+1,多项式的系数也多了一个,每次出生的多项式首次系数先选取为1,而后基于更新策略更新,若最高次项系数小于某个较小值,则舍去;
2)死亡过程
多项式的回归问题中,死亡过程是指多项式的阶次减1的过程,即相对于原有的M阶多项式,舍去最高阶项xM,因此,多项式的阶次由M变为M-1,多项式的系数也少了一个,多项式的其他低阶系数保持不变;
3)不变维时多项式系数更新过程
除了出生和死亡两个跨维的参数转移策略外,多项式的系数更新过程是基于Gibbs抽样实现的,具体过程如下:
A、第i步迭代时,
利用式(5)抽取多项式系数a=[a1,a2,a3,…,am]T,
a|(Xm,Y,σ2,δ2)~N(F,σ2H) (5)
式中,m是当前多项式的阶数,a是多项式的系数向量,Xm是自变量x针对不同次幂组成的m项多项式的各项的值,Y是多项式对应各自变量输入的多项式函数值;假设的多项式拟合的误差符合高斯分布,σ2是零均值误差的方差,δ2是一个尺度参数;式(5)中,H=(aTa+∑-1)-1,F=HXmY,此处,∑-1=δ-1XmTXm;
利用式(6)抽取σ2值,
式中,σ2是零均值误差的方差,v0和γ0是假设方差参数σ2符合逆伽马分布的两个超参数,N是自变量样本个数;Xm是自变量x针对不同次幂组成的m项多项式的各项的值,Y是多项式对应各自变量输入的多项式函数值;δ2是尺度参数,P=IN-XmHXmT,IN是N阶单位矩阵,
利用式(7)抽取参数δ2值,
式中,Xm是自变量x针对不同次幂组成的m项多项式的各项的值,Y是多项式对应各自变量输入的多项式函数值;δ2是一个尺度参数、a是多项式的系数向量、σ2是零均值误差的方差,和是假设尺度参数δ2符合逆伽马分布的两个超参数,m是当前多项式的阶数;
B、参数i值增加1,返回步骤2,直至i取值到设置的最大迭代N结束。
在此抽样过程中,算法迭代N次,前N/2次值被舍弃,后N/2次抽取的样本均值被用来作为各未知参数的估计值。
3.根据权利要求2所述的基于跨维马尔科夫链蒙特卡罗的自适应多项式回归方法,其特征在于,所述的步骤1中,有向无环概率图模型的建立方式如下:
未知变量表示为圆形框,已知的数据点对表示成矩形框,而方框表示的是未知参数的超参数;
对参数进行先验分布的假设:对于测量噪声ε,符合高斯噪声,设置其先验分布为零均值,方差为σ2,假设σ2符合共轭的逆伽马先验分布,即:σ2~IG(v0,γ0),δ2是一个尺度参数,也给其假设为共轭先验分布,在这里,是超参数,给其一个固定值,参数m是回归多项式的项数(阶次),其符合截断的泊松分布,当m取固定值时,数据矩阵Xm变为已知值,多项式系数a的先验设为多元高斯分布,即:a|(δ2,σ2,Xm)~N(0,σ2∑),此处,∑-1=δ-2XmTXm,式中,m是当前多项式的阶数,a是多项式的系数向量,Xm是自变量x针对不同次幂组成的m项多项式的各项的值,假设的多项式拟合的误差符合高斯分布,σ2是零均值误差的方差,δ2是尺度参数;
对于式(3)及式(4),εi=Yi-Ximai表示第i个数据样本对应的测量值和估计出的回归模型之间的误差,符合高斯分布,Xim表示Xm矩阵的第i行,采用如下的似然函数:
式中,N表示数据样本数,即要进行多项式回归或拟合的数据点个数,
贝叶斯多项式回归方法包括计算多项式系数a=[a1,a2,a3,…,am]T的后验分布,以及高斯噪声的方差,根据贝叶斯理论,参数的后验分布为:
上式中,p(Y|a,m,σ2,x)是似然函数,p(a1,a2,…,am,m,σ2)是参数的先验分布,基于已知的离散点,估计出多项式的系数a=[a1,a2,a3,…,am]T,
多项式的出生和死亡转移更新过程前面已经说明,当多项式项数不变时,其未知参数的Gibbs抽样更新过程,更新过程可参考步骤2中3)的采样过程,可以写出各未知参数(误差的方差、多项式系数和噪声参数δ2)的满条件分布。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910514947.7/1.html,转载请声明来源钻瓜专利网。