[发明专利]一种基于迁移学习的电力通信网数据质量提升方法在审

申请号：	201810445948.6	申请日：	2018-05-11
公开（公告）号：	CN108664607A	公开（公告）日：	2018-10-16
发明（设计）人：	杨济海;李仁华;彭汐单;巢玉坚;邓永康;伍小生;田晖;郑富永;王华;付萍萍;胡游君;邱玉祥;吕顺利;周鹏;邓伟;刘皓;蔡新忠;查凡;王宏;丁传文;刘洋;李石君;余伟;余放;李宇轩;李敏;彭亮;彭超;陈雪莲;陈艳华	申请（专利权）人：	国网江西省电力有限公司信息通信分公司;南瑞集团有限公司;武汉大学
主分类号：	G06F17/30	分类号：	G06F17/30;G06Q50/06;G06K9/62
代理公司：	武汉科皓知识产权代理事务所(特殊普通合伙) 42222	代理人：	鲁力
地址：	330077 ***	国省代码：	江西;36
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及到一种基于迁移学习的电力通信网数据质量提升方法。首先对集合L运用核判别分析，找到一种合适的核映射空间，并将L、U和O中的所有样本映射到核空间中，使得源领域和目标领域样本的边缘分布在核空间中非常接近。然后使用二分k均值算法在源领域中挑选和目标领域拥有相似的条件概率分布的样本。并在步骤1得到的核空间中，用步骤2挑选出的样本和目标领域有标记的样本共同训练一个模型，并为目标领域中没有标签的样本进行预测，最后得到对集合U的N种预测结果，运用多数投票法，确定集合U中样本最终的标签。本发明通过迁移学习有效地解决了训练集和测试集样本分布不一致的问题，解决了有标签样本较少而无法训练的问题，极大地节省了人力和财力。
搜索关键词：	样本目标领域电力通信网集合质量提升标签迁移源领域条件概率分布边缘分布均值算法判别分析样本分布映射空间预测结果不一致测试集投票法训练集有效地映射学习预测
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于迁移学习的电力通信网数据质量提升方法，其特征在于，基于定义：L＝{XL，YL}代表目标领域中有标签的样本，其中XL＝{x1，…，xγ}，YL＝{y1，…，yγ}，包含γ个样本；U＝{XU}代表目标领域中没有标签的样本，其中XU{xγ+1，…，xγ+u}，包含u个样本；O＝{XO，YO}代表源领域样本，包含o个样本，具体包括：步骤1，对集合L运用核判别分析，找到一种合适的核映射空间，并将L、U和O中的所有样本映射到核空间中，使得源领域样本在核空间的边缘分布接近目标领域样本在核空间的边缘分布；步骤2，在步骤1得到的核空间中，使用二分k均值算法(Bisecting k‑means)在源领域中挑选和目标领域拥有相似的条件概率分布的样本，并且记录下被挑选样本在原始空间中的原始样本集合S；步骤3，在步骤1得到的核空间中，用步骤2挑选出的样本和目标领域有标记的样本共同训练一个模型，并为目标领域中没有标签的样本进行预测；步骤4，步骤1‑3执行N次，在步骤1中，除首次寻找核映射空间的样本是在集合L中，后续循环执行均是在L和S的并集中寻找核映射空间的样本；最后得到对集合U的N种预测结果，运用多数投票法，确定集合U中样本最终的标签。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于国网江西省电力有限公司信息通信分公司;南瑞集团有限公司;武汉大学，未经国网江西省电力有限公司信息通信分公司;南瑞集团有限公司;武汉大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810445948.6/，转载请声明来源钻瓜专利网。

上一篇：一种大数据覆盖率采集分析方法
下一篇：可疑人员的识别方法、装置及计算机可读存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于迁移学习的电力通信网数据质量提升方法在审

专利文献下载