[发明专利]一种城镇燃气埋地管道腐蚀风险的智能预测方法在审
| 申请号: | 201810706730.1 | 申请日: | 2018-07-02 |
| 公开(公告)号: | CN109034546A | 公开(公告)日: | 2018-12-18 |
| 发明(设计)人: | 刘江涛;张涛;吴波;顾先凯;李夏喜;关鸿鹏;曹印锋 | 申请(专利权)人: | 北京市燃气集团有限责任公司 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/04;G06K9/62 |
| 代理公司: | 北京天方智力知识产权代理事务所(普通合伙) 11719 | 代理人: | 谷成 |
| 地址: | 100035 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 腐蚀 分类模型 随机森林 城镇燃气 埋地管道 智能预测 验证 腐蚀风险评估 传统管道 管道腐蚀 基本数据 健康样本 决策辅助 数据集合 数据建立 训练样本 样本数据 新数据 预测 准确率 消减 预设 泄漏 泄露 集合 燃气 采集 筛选 返回 预防 | ||
1.一种城镇燃气埋地管道腐蚀风险的智能预测方法,其特征在于:所述预测方法包括如下步骤;
步骤1,选取已发生腐蚀泄露的燃气埋地管道,获取其腐蚀样本数据集合;选取未发生腐蚀泄漏的燃气埋地管道,获取其健康样本数据集合;
步骤2,将所述腐蚀样本数据集合与所述健康样本数据集合进行数据比较,以筛选出具有相同类别的有用腐蚀样本数据和有用健康样本数据,将所述有用腐蚀样本数据和所述有用健康样本数据共同作为训练样本;
步骤3,对所述训练样本进行数据预处理,利用数据预处理后的训练样本对随机森林分类模型进行训练;
步骤4,对训练后的随机森林分类模型进行验证,如果验证的准确率大于或等于预设值,则执行步骤5;如果验证的准确率小于预设值,则再返回步骤3;
步骤5,将待被预测的燃气埋地管道的基本数据输入至训练后的随机森林分类模型中,以得到待被预测的燃气埋地管道腐蚀风险的预测结果。
2.根据权利要求1所述的城镇燃气埋地管道腐蚀风险的智能预测方法,其特征在于:步骤3中,对所述训练样本进行数据预处理的过程包括如下步骤;
步骤3a,挑选出所述训练样本中存在缺失值的目标特征集合;
步骤3b,判断所述目标特征集合所属的数据类型:如果目标特征集合所属的数据类型为数值型属性,则执行步骤3c;如果目标特征集合所属的数据类型为标称型属性,则执行步骤3d;
步骤3c,计算所述目标特征集合中所有值的平均值,然后将该平均值作为缺失值、补充至所述目标特征集合中,以完成缺失值预处理;
步骤3d,计算所述目标特征集合的众数,然后将该众数作为缺失值、补充至所述目标特征集合中,以完成缺失值预处理。
3.根据权利要求2所述的城镇燃气埋地管道腐蚀风险的智能预测方法,其特征在于:步骤3中,对所述训练样本进行数据预处理的过程包括如下步骤;
步骤3e,将所述训练样本中的目标特征集合的所有目标特征值由大到小或由小到大排序;
步骤3f,对排序后的所有目标特征值进行等宽分段,以完成离散化预处理。
4.根据权利要求3所述的城镇燃气埋地管道腐蚀风险的智能预测方法,其特征在于:步骤3中,通过如下方式对随机森林分类模型进行训练;
步骤3g,对数据预处理后的训练样本进行随机有放回采样,得到n个训练集,每个训练集由多个训练样例组成;
步骤3h,利用所述n个训练集分别对随机森林分类模型进行训练,以得到n个决策树模型;
步骤3i,对于任一个决策树模型,选取gini指数最小的划分点进行分裂,直至各个决策树模型自身的训练样例都属于同一类,从而生成n个决策树;
步骤3j,将生成的n个决策树组成随机森林,并通过多棵树分类器投票的方式将所述随机森林调整为训练后的随机森林分类模型。
5.根据权利要求1-4中任一权利要求所述的城镇燃气埋地管道腐蚀风险的智能预测方法,其特征在于:
步骤4中,采用k-折交叉验证方式对训练后的随机森林分类模型进行验证。
6.根据权利要求5所述的城镇燃气埋地管道腐蚀风险的智能预测方法,其特征在于:步骤4中,采用如下方式进行k-折交叉验证;
步骤4a,从训练样本中随机选出k个具有相同样本数量的样本集;
步骤4b,将k个样本集中的任一个样本集作为测试集、将其余k-1个样本集作为训练集,以进行k轮试验,共得到k个正确率;
步骤4c,将所述k个正确率的均值作为验证的准确率;如果验证的准确率小于预设值,则执行步骤5;否则返回步骤3。
7.根据权利要求6所述的城镇燃气埋地管道腐蚀风险的智能预测方法,其特征在于:
在步骤5前,还包括对所述待被预测的燃气埋地管道的基本数据进行缺失值预处理和/或离散化预处理的步骤。
8.根据权利要求1或7所述的城镇燃气埋地管道腐蚀风险的智能预测方法,其特征在于:
步骤1中,从燃气企业的事件记录中获取获取腐蚀样本数据集合,从燃气GIS系统中随机获取健康样本数据集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市燃气集团有限责任公司,未经北京市燃气集团有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810706730.1/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





