[发明专利]一种基于大数据模型的电力征信评估方法有效
| 申请号: | 202010413407.2 | 申请日: | 2020-05-15 |
| 公开(公告)号: | CN111612323B | 公开(公告)日: | 2023-03-28 |
| 发明(设计)人: | 段子荷;李翀;任鹏;刘林青;张冰玉;葛云龙 | 申请(专利权)人: | 国网河北省电力有限公司电力科学研究院;国网河北省电力有限公司营销服务中心;国网河北能源技术服务有限公司;国家电网有限公司 |
| 主分类号: | G06Q10/0635 | 分类号: | G06Q10/0635;G06Q10/04;G06Q50/06;G06Q10/0639;G06F18/2431;G06F18/22 |
| 代理公司: | 石家庄新世纪专利商标事务所有限公司 13100 | 代理人: | 李洪信;董金国 |
| 地址: | 050021 河*** | 国省代码: | 河北;13 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 数据模型 电力 评估 方法 | ||
1.一种基于大数据模型的电力征信评估方法,其特征在于采用如下步骤:
步骤一、收集内部企业电力数据和外部企业经营数据,基于模糊匹配实现企业经营数据和用电数据的融合,构建企业信用风险数据池;
步骤二、构建失信用电企业特征和高风险失信用电企业特征;
失信用电企业特征构建采用如下步骤:
A、使用已构建的企业信用风险数据池数据,对使用数据进行缺失值填充、异常数据识别和处理;
B、基于SOS算法优化参数的Catboost分类算法,使用已知失信用电企业数据中企业基本信息、企业资金信息项、企业风险信息项、企业内部基本信息、企业用电欠费指标项和企业用电缴费指标项作为输入特征训练Catboost分类算法,基于训练好的模型对所有用电企业用户进行类别概率判定并设置概率阈值P,当与失信企业相似度P时,确定为失信企业;
构建高风险失信用电企业特征采用如下步骤:
A、对用电企业历史用电数据和企业经营数据进行数据预处理;
B、基于企业历史用电量、缴费情况及经营情况数据,结合外部天气数据、节假日数据和特殊事件数据,采用LightGBM算法对未来一段时间用电及企业经营情况分别进行预测,得到未来一段时间企业用电量、欠费、缴费数值预测结果;
C、使用改进KNN算法计算预测结果与失信企业相似度,确定用户未来可能发生失信概率,设置阈值Q,当失信概率Q时,定位高风险失信用电企业;
步骤三、构建企业征信评估模型为企业信用打分,确定阈值,依据分数范围确立用户信用等级;
具体采用AHP层次分析法、TOPSIS综合评价法构建企业征信评估模型,包括如下步骤:
A、确定失信用电企业特征、高风险失信用电企业特征、企业缴费数据、企业欠费数据、企业纳税等级和企业风险数据各个特征的层次结构,
B、采用AHP层次分析法对上述各项指标赋值;
C、采用TOPSIS综合评价方法对企业进行逐一评价,得到企业信用分值,并设置阈值确定信用等级。
2.根据权利要求1所述的一种基于大数据模型的电力征信评估方法,其特征在于步骤一中的内部企业电力数据和外部企业经营数据由采用python环境下Fuzzy Wuzzy字符串模糊匹配融合形成用电企业信用风险数据池,所述Fuzzy Wuzzy为模糊字符串匹配算法库,其依据Levenshtein Distance算法计算两个字符序列之间的差异。
3.根据权利要求1所述的一种基于大数据模型的电力征信评估方法,其特征在于:所述Catboost分类算法为处理类别型特征的梯度提升算法库,其对所有样本进行随机排序,再针对类别型特征中的某个取值,每个样本的该特征转为数值型时都是基于排在该样本之前的类别标签取均值,同时加入了优先级和优先级的权重系数;使用如下公式将所有的分类特征值转换为数值,让σ=(σ1,…,σn),xσp,k代替为:
P是添加的先验项,
a是大于0的权重系数,
可降低类别特征中低频次特征带来的噪声;
CatBoost使用oblivious树作为基本预测器,在oblivious树中,每个叶子节点的索引可以被编码为长度等于树深度的二进制向量,计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网河北省电力有限公司电力科学研究院;国网河北省电力有限公司营销服务中心;国网河北能源技术服务有限公司;国家电网有限公司,未经国网河北省电力有限公司电力科学研究院;国网河北省电力有限公司营销服务中心;国网河北能源技术服务有限公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010413407.2/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





