[发明专利]一种基于用户用电行为的两阶段精细化聚类方法有效
申请号: | 202011136144.1 | 申请日: | 2020-10-22 |
公开(公告)号: | CN112257778B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 杨坚;项中明;叶琳;吴浩;周正阳;潘志超;蒋正邦;杨滢;陈新建;石博隆;张静;孙维真;张东波;于杰;洪道鉴;朱轶伦;王彬任;夏敏燕;高慧英;洪骋怀;丁春燕;苏崇;周洪青;廖培 | 申请(专利权)人: | 国网浙江省电力有限公司台州供电公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/06;G06T11/20 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 万尾甜;韩介梅 |
地址: | 318000 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 用电 行为 阶段 精细 化聚类 方法 | ||
1.一种基于用户用电行为的两阶段精细化聚类方法,其特征在于,具体包括如下步骤:
(1)以待聚类用户的每15min一点的负荷曲线为基础,归一化后形成待聚类用户负荷曲线数据集;
(2)采用K-means算法对步骤(1)建立的待聚类用户负荷曲线进行初次聚类,获得初次聚类结果,该结果包含各类用户负荷曲线的所属类别的对应编号以及相应的聚类中心;
(3)采用标准主成分分析PCA方法对步骤(2)中获得的初次聚类结果进行降维,将从属于各个聚类中心的负荷曲线从96维降至2维;并求取各类中96维负荷曲线在邻域内的点值作为Z轴数据,弥补前面降维的信息损失;最终得到各初次聚类类别中负荷曲线的分布密度;
(4)根据步骤(3)中获得的分布密度与使用者预想的再细分精度选择滤值阈值,根据邻域点数对原96维数据进行滤值后,再通过K-means聚类,得到精细化聚类结果;
步骤(4)中设定相应滤值阈值,所述滤值阈值根据使用者预想的精细化程度求得:
式中,epsilonm为滤值阈值,Dmaxm为第m个聚类簇的类内最大距离,K为使用者预想再细分的类数;
通过以上操作,得到各聚类簇的三维数据,通过三角形线性插补方式将三维数据加工成三维网格数据,作出三维网格图和颜色地形图,根据图像中的山峰数目选择滤值,滤值选择的具体方法为,降低滤值设定,直到大于滤值线的不连续数据段数大于设定的细分类数。
2.根据权利要求1所述的基于用户用电行为的两阶段精细化聚类方法,其特征在于,所述步骤(1)具体为:
记第i个用户的有功量测数据为:pi=[p1,…,pd,…,pD]T,其中d=1,…,D,D为日负荷曲线采样点数;
对有功量测数据进行归一化,归一化方法具体为:
其中pd’为归一化后的d时间点上用户i的负荷值,max(pd)为pi中的最大值,min(pd)为pi中的最小值。
3.根据权利要求1所述的基于用户用电行为的两阶段精细化聚类方法,其特征在于,所述步骤(2)具体为:
首先对众多的用户负荷依照其负荷曲线进行聚类,建立用户聚类模型,该模型采用欧式距离作为用户负荷的特征向量相似性评价指标,其目标函数如下:
式中,clow为用户的类数,U为用户总数,表示第n1个用户的负荷特征向量到第m1类的类中心的欧氏距离;为二进制变量,等于1表示第n1个用户属于第m1类,等于0则表示不属于该类;需满足:
同时为保证所有类均不为空集,还需满足:
之后采用传统的K-means聚类算法求解上述模型,获得初次聚类结果。
4.根据权利要求1所述的基于用户用电行为的两阶段精细化聚类方法,其特征在于,所述步骤(3)中:
采用标准主成分分析PCA方法对步骤(2)中获得的初次聚类结果进行降维,将从属于各个聚类中心的负荷曲线从96维降至2维,具体为:
待聚类的U个用户的96维负荷曲线,被写为U行,96列的特征矩阵X,对于特征矩阵X:
第一步首先计算特征矩阵X的样本的相关系数矩阵C;
第二步计算相关系数矩阵C的特征向量e1,e2,…,eN,以及对应的特征值,并将这些特征向量按对应特征值大小从上到下按行排列成矩阵,取前n列组成矩阵P=[e],其中n为降维后维数,取2;
第三步利用公式(6)投影数据到特征向量张成的空间之中;其中newX是降维后的X;
newX=XP (6)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司台州供电公司,未经国网浙江省电力有限公司台州供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011136144.1/1.html,转载请声明来源钻瓜专利网。