[发明专利]基于在线和离线决策集成学习的在线异构迁移学习的方法在审
| 申请号: | 201910820027.8 | 申请日: | 2019-08-31 |
| 公开(公告)号: | CN110569985A | 公开(公告)日: | 2019-12-13 |
| 发明(设计)人: | 吴庆耀;闫玉光;谭明奎;毕朝阳 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G06N20/20 | 分类号: | G06N20/20 |
| 代理公司: | 44102 广州粤高专利商标代理有限公司 | 代理人: | 何淑珍;江裕强 |
| 地址: | 510640 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 目标数据 目标域 源域 决策模型 离线 构建 皮尔森相关系数 集成学习 离线模型 数据计算 损失函数 相关参数 异构迁移 预测目标 在线决策 在线模型 初始化 计算源 域数据 迭代 异构 关联 预测 更新 决策 学习 | ||
1.基于在线和离线决策集成学习的在线异构迁移学习的方法,其特征在于,所述方法包括以下步骤:
S1:初始化在线的决策模型、离线的决策模型以及集成学习模型的模型参数;
S2:对在线得到的第i个新目标域数据xi建立在线和离线的组合决策模型计算预测值
S3:利用计算得到的预测值更新在线目标决策模型h(·);
S4:更新所述相关参数得到调整后的集成学习模型;
S5:重复步骤S2-S4直到参数收敛,得到训练好的集成学习模型。
集成学习模型最终由在线决策模型h(·)、离线决策模型hs(·)和组合控制参数θs、θt组成。后述公式(1)(2)(3)将分别给出在线决策模型、离线决策模型和组合集成学习模型的模型函数。
2.根据权利要求1所述的基于在线和离线集成学习的在线异构迁移学习的方法,其特征在于,所述步骤S1中,所述初始化方法如下:
S11:在线的决策模型的初始参数初始化为0;
S12:由源域的离线决策模型和目标域的在线决策模型组合的初始权重进行随机初始化。
3.根据权利要求1所述的基于在线和离线集成学习的在线异构迁移学习的方法,其特征在于,所述步骤S2中,所述计算预测值的具体方法为:
S21:得到有类标(有人工标注的真实数据类别)的源域数据和目标域数据两种异构的数据有共现数据相关联;这里使用上标s代表源域,上标t代表源域,上标c代表共现数据,n为样本总数,x代表样本特征,y代表样本类别,u代表共现数据中属于源域特征的部分,v代表代表共现数据中属于目标域特征的部分。
S22:分别计算源域数据和目标域数据与共现数据的皮尔森相关系数;目标域数据可以是与源域不同来源的数据,如文本数据。
S23:以共现数据与源域数据的相关系数和共现数据与目标域数据的相关系数为桥梁,计算源域同数据和目标域数据的相似性;
S24:找到与目标域数据xi最相似的k个源域数据,按照加权求和得出离线的决策模型,k为源域数据中于目标域数据xi最相似的数据的个数;
S25:组合在线和离线的决策模型,对目标域数据xi进行预测。
4.根据权利要求1所属的一种基于在线和离线集成学习的在线异构迁移学习的方法,其特征在于,所述步骤S3中,所述更新在线目标决策模型的方法如下:
根据S25的预测结果与目标域数据类标计算hinge损失并更新在线决策模型权重以及集成学习模型中组合控制参数的权重。
5.根据权利要求1所属的一种基于在线和离线集成学习的在线异构迁移学习的方法,其特征在于,所述源域数据为图像数据;所述目标域数据是文本数据;所述共现数据为两个数据域的结合,即文本与图像数据共同出现的数据,其特点是每个共现数据中文本与图像的意义是紧密关联或者一致的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910820027.8/1.html,转载请声明来源钻瓜专利网。





