[发明专利]一种用户用电行为主导影响因素挖掘方法有效
| 申请号: | 201810327870.8 | 申请日: | 2018-04-12 |
| 公开(公告)号: | CN108596227B | 公开(公告)日: | 2023-08-08 |
| 发明(设计)人: | 黄剑文;彭泽武;周珑;萧展辉;蔡徽;徐晖;钱正浩;严宇平;江疆 | 申请(专利权)人: | 广东电网有限责任公司 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F18/23213;G06F18/24;G06Q30/0201;G06Q50/06 |
| 代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
| 地址: | 510060 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用户 用电 行为 主导 影响 因素 挖掘 方法 | ||
1.一种用户用电行为主导影响因素挖掘方法,其特征在于,包括以下步骤:
S1:采集用户的电力数据,所述的电力数据包括用电数据和影响因素数据;
S2:对用户的电力数据进行标准化处理,得到标准化的电力数据;
S3:通过方差膨胀因子对标准化的电力数据进行多重相关性检验,若方差膨胀因子大于预设值,对标准化的电力数据进行筛选,得到筛选后的标准化的电力数据;若方差膨胀因子不大于预设值,不对标准化的电力数据进行筛选,执行S4;
S4:通过典型相关分析方法从电力数据或者筛选后的电力数据中提取相关性最大的两个变量,设为F1和F2,通过F1和F2判断影响因素数据中是否存在主导影响因素数据,若存在主导影响因素数据,则执行S5;若不存在主导影响因素数据,则方法结束;
S5:通过K-中心聚类方法从影响因素数据中得到主导影响因素数据;并通过MapReduce并行化技术实现聚类算法的并行化;
S6:以报表形式记录用户每日用电行为的主导影响因素数据并统计用户的用电行为的主导影响因素数据;结合GIS系统展现用户的用电行为的主导影响因素数据的空间分布特征;
所述的S4包括以下内容:
通过典型相关分析方法从自变量数据表A或自变量数据表A+和因变量数据表B中提取相关性最大的两个变量,设为F1和F2,以r(aj,F1)和r(bk,F1)为横坐标,以r(aj,F2)和r(bk,F2)为纵坐标绘制单位圆周;其中,r(aj,F1)表示自变量aj和主成分F1的相关系数,所述的r(aj,F1)通过下式进行表达:
式中,所述的Var是方差,所述的Cov是协方差;
若r(aj,F1)在预设的圆环宽度D内,若aj与bk点间距离小于给预设值D,则判定自变量数据表中存在对因变量数据表起主导性影响的变量,执行S5;若不存在主导影响因素数据,则方法结束;自变量数据表A中自变量记为aj,自变量aj中的数据记为aij;因变量数据表B,因变量数据表中的数据记为bik;
所述的S5包括以下流程:
S5.1:根据时间标记,将自变量数据表A或自变量数据表A+和因变量数据表B分解为若干个数据表,自变量数据表A分解的数据表设为Anm:{a1,,aj}nm;自变量数据表A+分解的数据表设为Anm+:{a1,,aj}nm;因变量数据表B分解的数据表设为Bnm:{b1,,bk}nm;所述的n为时间标记中的日标记;所述的m为时间标记中的时刻标记,m为整数,且m的取值范围是m=[1,24];
S5.2:在每个数据表Bnm中确定初始聚类中心;
S5.3:对每个数据表Bnm采用MapReduce函数并行执行K-中心聚类方法,得到每个数据表Bnm的主导影响因素数据;
S5.4:对所有数据表Bnm的聚类结果进行归约处理;
所述的S5.2包括以下内容:
通过公式d(bi,bj)度量数据表Bnm中的变量相似程度,所述的d(bi,bj)通过下式进行表达:
记变量bi与bj的相似性矩阵为U,所述的相似性矩阵U通过下式进行表达:
式中,所述的dij为变量bi与bj的相似性距离;
相似性矩阵U的最小距离理想解为:其中,
分别计算第i个变量bi到理想解的距离取距离最小的变量bi作为初始聚类中心。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司,未经广东电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810327870.8/1.html,转载请声明来源钻瓜专利网。





