[发明专利]一种基于机器学习的供水管网压力预测方法及系统在审
申请号: | 202110497008.3 | 申请日: | 2021-05-07 |
公开(公告)号: | CN113378335A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 陈洋臣;何卓彦;潘颖 | 申请(专利权)人: | 广州观必达数据技术有限责任公司 |
主分类号: | G06F30/18 | 分类号: | G06F30/18;G06F30/27;G06N20/00;G06F111/02;G06F113/14;G06F119/14 |
代理公司: | 广东高端专利代理事务所(特殊普通合伙) 44346 | 代理人: | 李彩凤 |
地址: | 510000 广东省广州市黄埔*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 供水 管网 压力 预测 方法 系统 | ||
1.一种基于机器学习的供水管网压力预测方法,其特征在于,所述方法包括:
获取历史压力数据;
对所述历史压力数据进行数据预处理,得到样本压力数据;
基于所述样本压力数据构建供水管网压力预测模型;
采用所述供水管网压力预测模型进行压力预测分析。
2.根据权利要求1所述的方法,其特征在于,在所述获取历史压力数据之后,以及,在所述对所述历史压力数据进行数据预处理,得到样本压力数据之前,所述方法还包括:
对所述历史压力数据进行水压分布分析,得到水压分布状况;
对所述历史压力数据进行周期性分析,得到各监测点对应于各时间周期的周期变化规律;
基于所述水压分布状况及所述周期变化规律设定数据预处理规则,用以针对所述历史压力数据进行数据预处理;
其中,所述数据预处理规则包括清洗方法、补值方法及变换方法,所述补值方法采用拉格朗日插值法。
3.根据权利要求2所述的方法,其特征在于,所述对所述历史压力数据进行数据预处理,得到样本压力数据,包括:
采用所述清洗方法筛除所述历史压力数据中的无效数据,所述无效数据包括重复数据、无关数据及错误数据;
检测所述历史压力数据中存在的缺值数据,以及,确定所述历史压力数据的因变量及自变量;
对分布于所述缺值数据前后的若干正常数据进行取值,得到若干缺值集合,每一所述缺值数据与每一所述缺值集合相对应;
基于所述因变量、所述自变量及所述缺值集合,采用拉格朗日插值法对所述缺值数据进行插值,得到中间历史压力数据;
采用所述变换方法对所述中间历史压力数据进行规范化处理,得到所述样本压力数据。
4.根据权利要求3所述的方法,其特征在于,所述基于所述样本压力数据构建供水管网压力预测模型,包括:
将所述样本压力数据划分为训练数据样本及测试数据样本;
根据时间梯度序列对所述训练数据样本进行排序,并基于每一所述监测点及每一时间梯度节点抓取所述训练数据样本中的a个数据实例,构造得到数据子集A;
在不包括所述第一数据实例的所述训练数据样本中随机采样b个数据实例,构造得到数据子集B;
对所述数据子集B中的数据实例设定梯度为(1-a)/b;
采用GOSS算法剔除所述数据子集A及所述数据子集B中权重值低于预设权重阈值的数据实例,计算信息增益;
采用EFB算法减少特征维度;
采用leaf-wise方法构造决策树,基于所述决策树生成所述供水管网压力预测模型。
5.根据权利要求4所述的方法,其特征在于,所述采用GOSS算法剔除所述数据子集A及所述数据子集B中权重值低于预设权重阈值的数据实例,计算信息增益,包括:
采用以下公式计算信息增益
其中,d为数据实例的样本总数,gi为梯度,为d节点的左子节点的样本总数,为d节点的右子节点的样本总数;
以及,Al={xi∈A:xij≤d};Ar={xi∈A:xij>d};Bl={xi∈B:xij≤d};Br={xi∈B:xij>d}。
6.一种基于机器学习的供水管网压力预测系统,其特征在于,所述系统包括:
数据获取单元,用于获取历史压力数据;
预处理单元,用于对所述历史压力数据进行数据预处理,得到样本压力数据;
模型构建单元,用于基于所述样本压力数据构建供水管网压力预测模型;
预测分析单元,用于采用所述供水管网压力预测模型进行压力预测分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州观必达数据技术有限责任公司,未经广州观必达数据技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110497008.3/1.html,转载请声明来源钻瓜专利网。