[发明专利]一种基于机器学习的水泵关键指标预测方法有效
申请号: | 202011547935.3 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112628132B | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 曾丹;姚文迪;张亦驰 | 申请(专利权)人: | 上海大学 |
主分类号: | F04B49/06 | 分类号: | F04B49/06;G05B13/04 |
代理公司: | 北京东方盛凡知识产权代理事务所(普通合伙) 11562 | 代理人: | 王颖 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 水泵 关键 指标 预测 方法 | ||
本发明提供一种基于机器学习的水泵关键指标预测方法,包括以下步骤:提取水泵日常工作数据,根据水泵运行关键指标对水泵日常工作数据进行预处理,得到训练集和验证集;根据水泵运行关键指标与其他数据之间的关系构建预测模型,并将训练集输入到预测模型进行模型的训练以及调参,并对模型进行评估;构建测试集,根据测试集及预测模型对水泵关键指标进行预测,指导水泵关键指标的工作条件寻优。本发明可以根据水泵工作过程中产生的数据,精准预测出水泵设备关键指标的状态值,并且输出影响水泵关键因素的重要特征,指导设备工作人员寻找最优的工作状态。
技术领域
本发明涉及水力发电技术领域,具体涉及一种基于机器学习的水泵关键指标预测方法。
背景技术
水泵是火电厂、灌溉排水一起其他工农业生产中的重要设备。对其关键指标进行监测,分析与预测运行发展趋势,可以提高水泵的工作效率和保障设备运行正常。
目前,水泵控制领域大多依赖于传统的工控软件,对整个控制做一些状态的仿真预测和监控。这样的操作存在一些问题,比如不能及时反应量化效果,不能对工况进行精细化控制,缺乏对关键指标的精确预测。人工线下通过对磨煤机指标的实时监测和设备参数的调控,会存在较高的人力、金钱和时间成本。而机器学习的方法可以通过对水泵系统中的时序数据进行建模仿真,实现对关键指标的精准预测。
发明内容
本发明的目的在于提出一种基于机器学习的水泵关键指标预测发法,可以根据水泵工作过程中产生的数据,精准预测出水泵设备关键指标的状态值,并且输出影响水泵关键因素的重要特征,指导设备工作人员寻找最优的工作状态。
为实现上述目的,本发明提供了如下方案:本发明提供一种基于机器学习的水泵关键指标预测方法,包括以下步骤:
提取水泵日常工作数据,根据水泵运行关键指标对水泵日常工作数据进行预处理,得到水泵关键指标训练集和验证集;
根据水泵运行关键指标与其他数据之间的关系构建预测模型,并将水泵关键指标训练集输入到预测模型进行模型的训练以及调参,并使用验证集对模型进行评估;
构建水泵关键指标测试集,根据水泵关键指标测试集及预测模型对水泵关键指标进行预测,指导水泵关键指标的工作条件寻优。
优选地,所述水泵关键运行指标包括水泵转速和水泵给水流量。
优选地,所述预处理的过程为:根据水泵的实际工作状况,剔除所述水泵转速小于50转时刻的数据,并使用箱线图的方法剔除数据中数值过大或过小的异常值;使用最邻近均值填充的方法填充数据中的缺失值。
优选地,所述使用箱线图的方法剔除数据中数值过大或过小的异常值的具体过程为:计算每个数据的第一四分位数Q1和第三四分位数Q3,大小处在Q1-1.5*IQR~Q3+1.5*IQR的值为正常值,超过这个范围的数值为异常值;其中,IQR=Q3-Q1。
优选地,所述根据水泵运行关键指标与其他数据之间的关系构建预测模型的过程为:根据数据中的稀疏程度选用不同的模型进行建模,对于稀疏数据使用套索算法构建模型,其他数据使用梯度提升决策树模型进行建模。
优选地,所述稀疏数据的获取过程为:统计数据中的非零元素个数,并根据数据个数及非零元素计算稀疏因子,当稀疏因子小于特定值时,则为稀疏数据。
优选地,所述稀疏因子的计算方式为:
其中:δ为稀疏因子;n×m为的数据集A的数据个数;t为非零元素个数。
本发明公开了以下技术效果:
(1)本发明仅需要水泵工作产生的数据,无需对水泵的先验知识,就可模拟预测出水泵关键指标的状态值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011547935.3/2.html,转载请声明来源钻瓜专利网。