[发明专利]一种居民用电的客户过户识别方法及系统有效
申请号: | 202011090918.1 | 申请日: | 2020-10-13 |
公开(公告)号: | CN112215420B | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 吴裕宙;何志强;骆华;谭伟聪;任龙霞;袁文伟;刘沛;梁永昌;尹玉芬;王伟然;谢庆新;叶智德;林建文;李韵诗;卢璇君 | 申请(专利权)人: | 广东电网有限责任公司;广东电网有限责任公司东莞供电局 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q30/0202;G06Q50/06 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 徐丽 |
地址: | 510060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 居民 用电 客户 过户 识别 方法 系统 | ||
1.一种居民用电的客户过户识别方法,其特征在于,包括:
采集原始数据;
对采集的原始数据进行初步处理,将初步处理后的数据进行数据分析,并基于电力营销业务系统中的明细数据对过户用户进行特征分析以建立预测指标集;
建立决策树模型,利用决策树模型构建出过户用户预测模型;
构建标签体系和定义标签规则,依据预测指标集建立标签模型,并将标签模型输入到所述过户用户预测模型中,实现过户用户的准确定位;
生成过户用户的全息画像,呈现出过户用户的特征标签,并依据过户用户的特征标签推送营销服务信息;
所述建立决策树模型,包括:以资料母群体为根节点;作单因子变异数的分析以找出变异量最大的变项作为分割准则;设定满足条件;若判断结果的正确率或涵盖率未满足条件,则再依最大变异量为条件长出分岔;
所述利用决策树模型构建出过户用户预测模型,包括:绘制树状图以建立决策树模型;根据已知条件排列出各方案和每一方案的各种自然状态,将各方案以及对应各方案自然状态的概率及损益值标于概率枝上;计算各个方案的期望值并将期望值标于该方案对应的状态结点上;比较各个方案的期望值,并标于对应的方案枝上,将期望值小的剪掉,所剩的最后方案为最佳方案;
所述根据已知条件排列出各方案和每一方案的各种自然状态,将各方案以及对应各方案自然状态的概率及损益值标于概率枝上,包括:
将所有方案依次划分为n类,并记为x1、x2、…、xn,每一类取得的概率对应为p1、p2、…、pn;
定义x的墒为其中,0≤H(x)≤log(n);
当随机变量只取两个值时,x的分布为:
P(x=1)=p,X(x=o)=1-p,0≤p≤1;
H(x)=-plog2(p)-(1-p)log2(p)。
2.根据权利要求1所述的一种居民用电的客户过户识别方法,其特征在于,所述对采集的原始数据进行初步处理,将初步处理后的数据进行数据分析,包括:
读取原始数据,对原始数据中的空值、缺失值、唯一值和异常值进行检验;
其中,对空值和缺失值的比例进行计算,将空值或缺失值占比大于40%的变量做删除处理,将空值或缺失值占比小于等于40%的变量通过三次样条插值法进行填充处理;对唯一值和异常值均做删除处理;
对连续数据进行数据离散化处理得到离散化数据;
将离散化数据和原始数据中的离散型数据进行数据合并,并计算其woe-iv值;
对计算获得的woe-iv值进行排序,并设定woe-iv值的判定阈值,将小于woe-iv值判定阈值的变量剔除,将大于等于woe-iv值判定阈值的变量留存。
3.根据权利要求1所述的一种居民用电的客户过户识别方法,其特征在于,所述特征分析包括用电特征、缴费行为和联系方式,从所述用电特征、缴费行为和联系方式中选择影响用户分析的指标作为预测指标集。
4.根据权利要求1所述的一种居民用电的客户过户识别方法,其特征在于,所述利用决策树模型构建出过户用户预测模型,包括:
将经过数据分析后的变量分别输入到决策树人工智能算法中对租房用户预测模型进行训练,从而对过户用户的类别进行预测,并基于逻辑算法结果进行加权平均的方式获得最后的预测结果;
设定用户分类阈值,当大于用户分类阈值时设定为1,判定为过户用户,当小于或等于用户分类阈值时设定为0,判定为非过户用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司;广东电网有限责任公司东莞供电局,未经广东电网有限责任公司;广东电网有限责任公司东莞供电局许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011090918.1/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理