[发明专利]一种多任务稀疏贝叶斯极限学习机回归方法有效
| 申请号: | 202010097148.7 | 申请日: | 2020-02-17 |
| 公开(公告)号: | CN111291898B | 公开(公告)日: | 2020-12-11 |
| 发明(设计)人: | 黄永;李惠;高竞泽 | 申请(专利权)人: | 哈尔滨工业大学 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/04;G06N3/08 |
| 代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 孙莉莉 |
| 地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 任务 稀疏 贝叶斯 极限 学习机 回归 方法 | ||
1.一种多任务稀疏贝叶斯极限学习机回归方法,其特征在于:所述回归方法应用于岩土工程中,具体包括以下步骤:
步骤一、对于单隐含层神经网络,由零均值高斯分布随机生成神经网络输入层权值矩阵Φ和隐含层神经元偏置矩阵B,对全部L个任务的输入xi(i=1...L)均使用相同的Φ和B映射到高维空间Hi=f(xiΦ+B),从而构建L个任务的基函数矩阵Hi;
步骤二、通过多任务稀疏贝叶斯学习方法,从L个任务的基函数矩阵Hi和L个任务的输出ti(i=1...L)中推断出L个任务共享的超参数αj,j=1...M,M为隐含层神经元个数,并得到每个任务各自的输出层权值wi的后验概率分布;
步骤三、从输出层权值wi的后验概率分布中选取合适的值作为神经网络输出层权值,令每个任务输出层权值wi=μi,μi为后验概率分布最大值处,在高斯分布中为均值;
所述全部L个任务包括任务1和任务2,对于任务1,以液性指数、竖向有效应力为输入,土壤灵敏度的对数值为输出;对于任务2,以液性指数、竖向有效应力为输入,预固结应力的对数值为输出。
2.根据权利要求1所述的方法,其特征在于:所述步骤一具体为:
步骤1.1、基于极限学习机的回归问题能够统一写为:
其中,wj为输出层权值,θj为与第j个隐含层节点相连输入层权值与隐含层偏置参数,对于全部M个隐含层节点Θ=[θ1,...,θM],包含了从零均值高斯分布中随机生成的神经网络输入层权值矩阵Φ和隐含层神经元的偏置矩阵B;hj(.)为激活函数,极限学习机中取为
步骤1.2、对全部L个任务,均使用相同输入层至隐含层参数Θ,即全部L个任务的输入层权值矩阵Φ和隐含层神经元偏置矩阵B均相同,仅输入xi不同,从而由不同任务中得到L个行数不同、列数相同的基函数矩阵:
其中,N为数据量;
步骤1.3、步骤1.1中的回归问题改写为矩阵形式:
Hw=T
对于极限学习机而言,通过求H的M-P广义逆能够求解输出层权值w;在多任务稀疏贝叶斯极限学习机中,通过层次贝叶斯模型对输出层权值w进行求解。
3.根据权利要求2所述的方法,其特征在于:所述步骤二具体为:
步骤2.1、对于第i个任务的输出层权值wi,其先验分布建模为零均值高斯分布:
其中,α0为噪声精度参数,其先验建模为Gamma分布:
p(α0|a,b)=Ga(α0|a,b)
其中,a是形状参数,b是逆尺度参数;
步骤2.2、对于第i个任务的输出层权值wi,其后验分布经推导为:
其中:
A=diag(α1,α2,...,αM)
步骤2.3、超参数α通过经验贝叶斯方法估计,并可得到输出层权值的后验分布μ,∑:具体为:
步骤2.3.1、初始化α:对j=1...M分别计算证据函数增量:
其中:
Ki=Ni+2a
si,j=H′i,jHi,j
qi,j=H′i,jti
gi,j=t′iti+2b
对证据函数增量最大的神经元j,重新估计其对应的超参数αj:
步骤2.3.2、如用j表示α发生更新的基函数序号,k表示当前已考虑的基函数序号,l表示全部基函数序号,只需进行如下步骤的循环即可求解参数和超参数α,μ,∑:
(1)通过αj计算出每个任务的μi,∑i,Si,l,Qi,l,Gi;
(2)通过以下公式计算判别式θj
si,j=αjSi,j/(αj-Si,j)
qi,j=αjQi,j/(αj-Si,j)
θj大于0的基函数保留在模型中,θj小于0的基函数从模型中剔除,由此形成三种状态:增添基函数、删除基函数、重新估计基函数;对应三种状态分别求出证据函数的增量,选择增量最大的方案对αj进行修改,即令表示更新后的超参数αj,重复上述过程进行循环;
对于增添基函数、删除基函数和重新估计基函数,下面给出αj更新后证据函数增量及μi,∑i,Si,l,Qi,l,Gi的计算方法,对于多任务情况,总的证据函数增量只需对所有任务的证据函数增量进行求和即可;
a.增添基函数
通过以下公式计算μi,∑i,Si,l,Qi,l,Gi:
其中,∑i,jj=(αi,j+Si,j)-1,μi,j=∑i,jjQi,j,ei,j=Hi,j-Hi∑iH′iHi,j
b.重新估计基函数
通过以下公式计算μi,∑i,Si,l,Qi,l,Gi:
其中,∑i,k是∑i的第k列,
c.删除基函数
通过以下公式计算μi,∑i,Si,l,Qi,l,Gi:
步骤2.4、当证据函数增量小于阈值时,结束循环,得到单隐含层神经网络输出层权值的后验概率分布均值μi,令每个任务的输出层权值wi=μi即可,得到的每个任务的输出层权值wi为高度稀疏的,且对于所有任务,wi中非零项出现在相同位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010097148.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种空气过滤器的内部液冷循环系统
- 下一篇:一种吸透波一体化吸波器





