[发明专利]一种面向电力用户细分的鲁棒k-means聚类方法有效
申请号: | 201710599773.X | 申请日: | 2017-07-21 |
公开(公告)号: | CN107358368B | 公开(公告)日: | 2021-07-20 |
发明(设计)人: | 杨名;李强;罗海波;刘琪琛 | 申请(专利权)人: | 国网四川省电力公司眉山供电公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/06;G06K9/62 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 梁田 |
地址: | 620000 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 电力 用户 细分 means 方法 | ||
本发明公开了一种面向电力用户细分的鲁棒k‑means聚类方法,包括以下步骤,步骤1:提取电力公司任意一组数据集,进行数据标准化处理,所述数据集由多个簇组成;步骤2:提取标准化处理以后的数据集,计算数据集中样本间的相异度;步骤3:提取步骤2中数据集中样本间的相异度,使用改进的MaxMin初始化方法选择初始聚类中心,确定聚类中心的数量和类型;步骤4:根据步骤3中聚类中心的数量和类型,自动的分裂或合并簇。本发明所要解决的技术问题是电力部门通过对用户档案进行主观判断进行归类,并不能实现对用户准确、快速、细致的归类,但是本发明所提出的新颖、鲁棒的k‑means聚类方法可以解决这一缺点。
技术领域
本发明涉及一种电力用户细分方法,具体涉及一种面向电力用户细分的鲁棒k-means聚类方法。
背景技术
电力作为最基本的生活、生产能源,用电客户类型非常复杂而丰富。传统模式下,电力部门是通过对用户档案进行主观判断进行归类。该方法由于人力成本和人工理解深度的限制,并不能实现对用户准确、快速、细致的归类。
发明内容
本发明所要解决的技术问题是电力部门通过对用户档案进行主观判断进行归类,但是人力成本和人工理解深度的限制,并不能实现对用户准确、快速、细致的归类,目的在于提供一种面向电力用户细分的鲁棒k-means聚类方法,解决电力部门不能实现对用户准确、快速、细致的归类的问题。
本发明通过下述技术方案实现:
一种面向电力用户细分的鲁棒k-means聚类方法,包括以下步骤,步骤1:提取电力公司任意一组数据集,进行数据标准化处理,所述数据集由多个簇组成;步骤2:提取标准化处理以后的数据集,计算数据集中样本间的相异度;步骤3:提取步骤2中数据集中样本间的相异度,使用改进的MaxMin初始化方法选择初始聚类中心,确定聚类中心的数量和类型;步骤4:根据步骤3中聚类中心的数量和类型,自动的分裂或合并簇。本发明所要解决的技术问题是电力部门通过对用户档案进行主观判断进行归类,但是人力成本和人工理解深度的限制,并不能实现对用户准确、快速、细致的归类,但是本发明所提出的新颖、鲁棒的k-means聚类方法可以解决这一缺点。此方法通过对海量用户信息进行关键聚类信息识别以进行自动的聚类处理。所述数据集由多个簇组成,这是为了后续的解释方便,做了一个自定义;聚类分析作为一个广受欢迎的数据分析和数据挖掘技术,旨在将一组数据对象按相似性分成若干簇,使得同一个簇内的数据对象尽可能相似,不同簇内的对象尽可能相异。
所述步骤1中标准化处理的方法包括最大最小规范化、z-score规范化和小数定标规范化。标准化处理可以去除数据中的空缺和冗余,保证所得结果准确有效。
所述步骤2中,计算数据集中样本间的相异度,当数据样本属性为数值型,采用欧氏距离计算数据样本间的相异度;当数据样本属性为混合类型,采用公式(1)计算数据样本间的相异度:其中,xi和xj是两个数据样本;k是数据样本的维度,即属性个数;d(xi,m,xj,m)是数据样本xi和xj在第m维上的相异度;δm是第m维的指示项,当xi,m或xj,m缺失,或者xi,m=xj,m=0,且变量m是非对称二元变量,则指示项δm=0,否则,指示项δm=1。对数据所有维度进行判断,保证准确。
所述步骤3中改进的MaxMin初始化方法选择初始聚类中心,包括以下子步骤:S401:假设一个n个对象的数据集X,选择离所有对象的均值最近的对象作为第一个聚类中心m1;如此做可以避免对初始聚类中心的选择敏感,避免选择不同的初始聚类中心将导致不同的聚类结果。
S402:对于其余的对象,计算每个对象和已选定的簇中心之间的最小距离,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网四川省电力公司眉山供电公司,未经国网四川省电力公司眉山供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710599773.X/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理