[发明专利]一种基于迁移学习的电力通信网数据质量提升方法在审
申请号: | 201810445948.6 | 申请日: | 2018-05-11 |
公开(公告)号: | CN108664607A | 公开(公告)日: | 2018-10-16 |
发明(设计)人: | 杨济海;李仁华;彭汐单;巢玉坚;邓永康;伍小生;田晖;郑富永;王华;付萍萍;胡游君;邱玉祥;吕顺利;周鹏;邓伟;刘皓;蔡新忠;查凡;王宏;丁传文;刘洋;李石君;余伟;余放;李宇轩;李敏;彭亮;彭超;陈雪莲;陈艳华 | 申请(专利权)人: | 国网江西省电力有限公司信息通信分公司;南瑞集团有限公司;武汉大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/06;G06K9/62 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 鲁力 |
地址: | 330077 *** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及到一种基于迁移学习的电力通信网数据质量提升方法。首先对集合L运用核判别分析,找到一种合适的核映射空间,并将L、U和O中的所有样本映射到核空间中,使得源领域和目标领域样本的边缘分布在核空间中非常接近。然后使用二分k均值算法在源领域中挑选和目标领域拥有相似的条件概率分布的样本。并在步骤1得到的核空间中,用步骤2挑选出的样本和目标领域有标记的样本共同训练一个模型,并为目标领域中没有标签的样本进行预测,最后得到对集合U的N种预测结果,运用多数投票法,确定集合U中样本最终的标签。本发明通过迁移学习有效地解决了训练集和测试集样本分布不一致的问题,解决了有标签样本较少而无法训练的问题,极大地节省了人力和财力。 | ||
搜索关键词: | 样本 目标领域 电力通信网 集合 质量提升 标签 迁移 源领域 条件概率分布 边缘分布 均值算法 判别分析 样本分布 映射空间 预测结果 不一致 测试集 投票法 训练集 有效地 映射 学习 预测 | ||
【主权项】:
1.一种基于迁移学习的电力通信网数据质量提升方法,其特征在于,基于定义:L={XL,YL}代表目标领域中有标签的样本,其中XL={x1,…,xγ},YL={y1,…,yγ},包含γ个样本;U={XU}代表目标领域中没有标签的样本,其中XU{xγ+1,…,xγ+u},包含u个样本;O={XO,YO}代表源领域样本,包含o个样本,具体包括:步骤1,对集合L运用核判别分析,找到一种合适的核映射空间,并将L、U和O中的所有样本映射到核空间中,使得源领域样本在核空间的边缘分布接近目标领域样本在核空间的边缘分布;步骤2,在步骤1得到的核空间中,使用二分k均值算法(Bisecting k‑means)在源领域中挑选和目标领域拥有相似的条件概率分布的样本,并且记录下被挑选样本在原始空间中的原始样本集合S;步骤3,在步骤1得到的核空间中,用步骤2挑选出的样本和目标领域有标记的样本共同训练一个模型,并为目标领域中没有标签的样本进行预测;步骤4,步骤1‑3执行N次,在步骤1中,除首次寻找核映射空间的样本是在集合L中,后续循环执行均是在L和S的并集中寻找核映射空间的样本;最后得到对集合U的N种预测结果,运用多数投票法,确定集合U中样本最终的标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江西省电力有限公司信息通信分公司;南瑞集团有限公司;武汉大学,未经国网江西省电力有限公司信息通信分公司;南瑞集团有限公司;武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810445948.6/,转载请声明来源钻瓜专利网。