[发明专利]一种纵向数据融合的隐私计算方法及系统有效
申请号: | 202210504887.2 | 申请日: | 2022-05-10 |
公开(公告)号: | CN115130814B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 赵张梦茹;马骏;王向阳;李沛哲;谭祺龙;刘彤;吕丰 | 申请(专利权)人: | 中南大学;湖南能源大数据中心有限责任公司 |
主分类号: | G06Q10/0639 | 分类号: | G06Q10/0639;G06Q50/06;G06F18/25;G06N20/00 |
代理公司: | 长沙朕扬知识产权代理事务所(普通合伙) 43213 | 代理人: | 何湘玲 |
地址: | 410083 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 纵向 数据 融合 隐私 计算方法 系统 | ||
1.一种纵向数据融合的隐私计算方法,用于电力数据和移动人口数据的融合,其特征在于,包括以下步骤:
输入想要评价的商圈的地理位置和时间段,中心服务器将任务模型拆解为若干个子任务;其中每个子任务,仅需要一个数据中心的原始数据;
将各子任务分配至所需的原始数据对应的数据中心进行计算;
各数据中心根据最佳影响权重的索引值找到对应的自身的最佳影响权重,结合本地商圈的电力数据和移动人口数据计算出子任务结果并上传至中心服务器;
中心服务器将各数据中心的上传的子任务结果进行融合,得到商圈活跃度隐私计算的最终结果;
所述中心服务器和各数据中心的任务计算模型,通过以下步骤训练得到:
中心服务器构建隐私计算的任务模型;将所述任务模型拆解为若干个子任务;其中每个子任务,仅需要一个数据中心的原始数据;
将各子任务分配至所需的原始数据对应的数据中心进行计算;
各数据中心分别获取自身数据库中被选中作为训练集的商圈的电力数据或移动人口数据,将自身的电力数据或移动人口数据中的每个样本采用与自身数据相关的正向指标进行标记并排序,形成样本排序数组并上传至中心服务器;
中心服务器根据各数据中心的排序数组生成总排序并分配相应的标签值,随后进行模型训练,训练过程中仅交互中间量,训练结束时得到电力数据和移动人口数据中的各特征对商圈总体活跃度的最佳影响权重的索引值并下发给对应的数据中心;
所述进行模型训练,包括进行以下迭代训练过程:
中心服务器根据各数据中心上传的子任务结果计算出商圈活跃度的预测值以及残差值其中yi为商圈活跃度的标签值;为yi对应的商圈活跃度的预测值;M为样本数;ω为影响权重;将残差值下发给对应的各数据中心;
数据中心根据中心服务器下发的残差值更新本地影响权重,根据所述各特征对商圈总体活跃度的影响权重以及对应的样本,计算子任务,并将子任务结果上传至中心服务器;
中心服务器在上述迭代中过程中找出最佳影响权重的索引值,所述索引值指向残差值最小的计算过程,并将索引值下发至数据中心,以便数据中心选择索引值对应的本地影响权重的计算时所使用的影响权重作为最佳影响权重,以最佳影响权重对应的子计算模型作为训练完成的子计算模型;
所述中心服务器根据各特征以及影响权重,采用线性回归模型计算商圈活跃度的预测值其表达式如下:
其中x1至xN为电力数据或者移动人口数据的样本中包含的N个特征,X为数据中心的样本,其影响权重对应为ω1至ωN。
2.根据权利要求1所述的纵向数据融合的隐私计算方法,其特征在于,所述电力数据为包含以下人口特征的样本:
合同状态:Pc=Dt/Dr,即合同剩余时长占比=合同剩余时长(天)/合同时长(天);
容量状态:Pa=At/Ac,即实际运行率=实际运行容量(kW)/合同容量(kW);
电费缴纳水平:年度电量消费金额SA_Yy,季度电量消费金额月度电量消费金额
违约用电:欠费次数Ns,违约金额DAt;
周期用电水平:峰电量kwh(10-15,18-21)Wp,平电量kwh(7-10,15-18,21-23)Wf,谷电量kwh(23-7)Wv,正向有功电量Wt=峰值+平值+谷值;
周期用电时长:通过计算日度、月度、季度、年度等1个自然周期内实际用电时长占比Pd,Pm,Ps,Py;
用电量增速:通过同比、环比分析用电量具体变化幅度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学;湖南能源大数据中心有限责任公司,未经中南大学;湖南能源大数据中心有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210504887.2/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置