[发明专利]一种基于机器学习的水泵关键指标预测方法有效
申请号: | 202011547935.3 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112628132B | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 曾丹;姚文迪;张亦驰 | 申请(专利权)人: | 上海大学 |
主分类号: | F04B49/06 | 分类号: | F04B49/06;G05B13/04 |
代理公司: | 北京东方盛凡知识产权代理事务所(普通合伙) 11562 | 代理人: | 王颖 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 水泵 关键 指标 预测 方法 | ||
1.一种基于机器学习的水泵关键指标预测方法,其特征在于,包括以下步骤:
提取水泵日常工作数据,根据水泵运行关键指标对水泵日常工作数据进行预处理,得到水泵关键指标训练集和验证集;
根据水泵运行关键指标与其他数据之间的关系构建预测模型,并将水泵关键指标训练集输入到预测模型进行模型的训练以及调参,并使用验证集对模型进行评估;
所述根据水泵运行关键指标与其他数据之间的关系构建预测模型的过程为:根据数据中的稀疏程度选用不同的模型进行建模,对于稀疏数据使用套索算法构建模型,其他数据使用梯度提升决策树模型进行建模;
所述稀疏数据的获取过程为:统计数据中的非零元素个数,并根据数据个数及非零元素计算稀疏因子,当稀疏因子小于特定值时,则为稀疏数据;
所述稀疏因子的计算方式为:
(1)
其中:
选用梯度提升决策树模型进行建模;使用随机搜索调参的方法对梯度提升决策树模型的参数n_estima tors、learning_rate、subsample、max_features、max_depth、min_samples_split、min_samples_leaf这7个参数进行参数寻优,交叉验证选择3折作为模型评估;调参之后输出所述模型对于水泵转速和给水流量的特征重要度;使用均方根误作为所述模型的评价指标,对所述验证集的预测结果进行评估;
构建水泵关键指标测试集,根据水泵关键指标测试集及预测模型对水泵关键指标进行预测,指导水泵关键指标的工作条件寻优;所述构建水泵关键指标测试集的过程为:依据所述模型的特征重要度,修改重要特征的数值来构建测试集;
所述依据水泵关键指标测试集及预测模型对水泵关键指标进行预测的过程为:
依次修改最重要的特征,尝试不同的特征组合;通过单一变量法,修改一个变量的数值大小,保持其他特征变量数值大小不变,构成新的数据来进行预测;观察重要特征变化时,关键指标的变化情况。
2.根据权利要求1所述的基于机器学习的水泵关键指标预测方法,其特征在于,所述水泵关键运行指标包括水泵转速和水泵给水流量。
3.根据权利要求2所述的基于机器学习的水泵关键指标预测方法,其特征在于,所述预处理的过程为:根据水泵的实际工作状况,剔除所述水泵转速小于50转时刻的数据,并使用箱线图的方法剔除数据中数值过大或过小的异常值;使用最邻近均值填充的方法填充数据中的缺失值。
4.根据权利要求3所述的基于机器学习的水泵关键指标预测方法,其特征在于,所述使用箱线图的方法剔除数据中数值过大或过小的异常值的具体过程为:计算每个数据的第一四分位数Q1和第三四分位数Q3,大小处在Q1-1.5*IQR~Q3+1.5*IQR的值为正常值,超过这个范围的数值为异常值;其中,IQR=Q3-Q1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011547935.3/1.html,转载请声明来源钻瓜专利网。