[发明专利]一种基于迁移学习的电力通信网数据质量提升方法在审
申请号: | 201810445948.6 | 申请日: | 2018-05-11 |
公开(公告)号: | CN108664607A | 公开(公告)日: | 2018-10-16 |
发明(设计)人: | 杨济海;李仁华;彭汐单;巢玉坚;邓永康;伍小生;田晖;郑富永;王华;付萍萍;胡游君;邱玉祥;吕顺利;周鹏;邓伟;刘皓;蔡新忠;查凡;王宏;丁传文;刘洋;李石君;余伟;余放;李宇轩;李敏;彭亮;彭超;陈雪莲;陈艳华 | 申请(专利权)人: | 国网江西省电力有限公司信息通信分公司;南瑞集团有限公司;武汉大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/06;G06K9/62 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 鲁力 |
地址: | 330077 *** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 目标领域 电力通信网 集合 质量提升 标签 迁移 源领域 条件概率分布 边缘分布 均值算法 判别分析 样本分布 映射空间 预测结果 不一致 测试集 投票法 训练集 有效地 映射 学习 预测 | ||
1.一种基于迁移学习的电力通信网数据质量提升方法,其特征在于,基于定义:L={XL,YL}代表目标领域中有标签的样本,其中XL={x1,…,xγ},YL={y1,…,yγ},包含γ个样本;U={XU}代表目标领域中没有标签的样本,其中XU{xγ+1,…,xγ+u},包含u个样本;O={XO,YO}代表源领域样本,包含o个样本,具体包括:
步骤1,对集合L运用核判别分析,找到一种合适的核映射空间,并将L、U和O中的所有样本映射到核空间中,使得源领域样本在核空间的边缘分布接近目标领域样本在核空间的边缘分布;
步骤2,在步骤1得到的核空间中,使用二分k均值算法(Bisecting k-means)在源领域中挑选和目标领域拥有相似的条件概率分布的样本,并且记录下被挑选样本在原始空间中的原始样本集合S;
步骤3,在步骤1得到的核空间中,用步骤2挑选出的样本和目标领域有标记的样本共同训练一个模型,并为目标领域中没有标签的样本进行预测;
步骤4,步骤1-3执行N次,在步骤1中,除首次寻找核映射空间的样本是在集合L中,后续循环执行均是在L和S的并集中寻找核映射空间的样本;最后得到对集合U的N种预测结果,运用多数投票法,确定集合U中样本最终的标签。
2.根据权利要求1所述的一种基于迁移学习的电力通信网数据质量提升方法,其特征在于,所述步骤1具体包括:
步骤1.1、计算矩阵W;W=(Wi)i=1,…,NC是块对角矩阵,Wi是li×li的矩阵,Wi中的每个元素均是1/li,其中li是第i类样本的数量,NC是样本类别总数的,即:
步骤1.2、计算核矩阵K;核函数κ(xi,xj)定义了在特征空间F中的点积运算,即κ(xi,xj)=φ(xi)·φ(xj),核矩阵K的每一个元素是κij=κ(xi,xj);本发明选择高斯核作为核函数,即:σ>0为高斯核的带宽;
步骤1.3、简化目标函数;对核矩阵K运用特征向量的分解,得到K=PΛPT,其中,Λ是由非零特征值组成的对角矩阵,P的列向量是单位特征向量并且互相正交,特征向量和Λ中的特征值相对应;则目标函数简化为:
λβ=PTWPβ
其中,β=ΛPTα,求出使λ值最大的β,相应的α便可计算出;
步骤1.4、样本映射到核空间;样本z到v的投影为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江西省电力有限公司信息通信分公司;南瑞集团有限公司;武汉大学,未经国网江西省电力有限公司信息通信分公司;南瑞集团有限公司;武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810445948.6/1.html,转载请声明来源钻瓜专利网。