[发明专利]一种基于机器学习的农作物需水量预测方法在审
| 申请号: | 201910715273.7 | 申请日: | 2019-08-05 |
| 公开(公告)号: | CN110428106A | 公开(公告)日: | 2019-11-08 |
| 发明(设计)人: | 孙丰刚;兰鹏;魏珉;张凤航;张顺航;李金泽;李健名;彭志颖;李凤迪;宋新财;刘羽嘉;尹明辉 | 申请(专利权)人: | 山东农业大学 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/02;G06K9/62 |
| 代理公司: | 泰安市诚岳专利代理事务所(特殊普通合伙) 37267 | 代理人: | 邱强 |
| 地址: | 271000 *** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 农作物需水量 基于机器 气象特征 作物生长 预测 数据预处理 水资源配置 阶段数据 阶段特征 结果预测 数据采集 小数据 优化 农作物 学习 评估 | ||
1.一种基于机器学习的农作物需水量预测方法,其特征在于:该方法步骤包括:(1)历史气象特征数据采集;(2)作物生长阶段数据获取;(3)数据预处理;(4)搭建XGBoost模型;(5)调节参数,优化XGBoost模型;(6)结果预测与评估:
(1)历史气象特征数据获取:设定农田实验区域,利用传感器采集农作物生长环境气象特征信息,包括光照、温度、湿度,并将感知结果通过无线传输方式传送到数据终端;
(2)作物生长阶段数据获取;所述生长阶段数据包括:单株叶面积、系数以及生长天数;
(3)数据预处理:通过随机森林算法分析出对最终需水量预测结果影响较大的因素,清理异常数据、脏数据;
(4)搭建XGBoost模型:将采集到的气象特征数据和作物生长数据整合成两部分,分别用于训练和测试,将训练数据导入XGBoost(eXtreme Gradient Boosting)模型中,采用模型默认参数对农作物需水量预测;
(5)调节参数,优化XGBoost模型:对训练数据的预测结果进行评估,调节参数来优化XGBoost模型;
(6)结果预测与评估:导入训练数据,先采用模型默认参数对农作物进行需水量预测,评估预测效果,然后进行参数调节以此来优化模型,在进行预测,采用拟合优度为评价指标,其含义是训练集估计和所学模型产生的新数据集评估的偏离度,其值越大表示拟合优度越好,可以较好反映出预测效果。
2.根据权利要求1所述的基于机器学习的农作物需水量预测方法,其特征在于:步骤(1)中的气象特征进一步细化为:日累积平均光照、日平均光照、日最大光照、日平均温度、昼平均温度、日最大温度、日最小温度、日平均湿度、昼平均湿度、日最大湿度、日最小湿度。
3.根据权利要求1所述的基于机器学习的农作物需水量预测方法,其特征在于:步骤(2)中,系数k=需水量/蒸发皿蒸发量,单株叶面积每10天测一次,需水量测定为每两天测一次,取平均值;其中,需水量测定的方式选用称重法。
4.根据权利要求1所述的基于机器学习的农作物需水量预测方法,其特征在于:所述的步骤(4)中,XGBoost模型,其最基本组成部分为回归树,会根据训练特征及训练数据构建分类树,为保证XGBoost模型的精度和可泛化,首先构造学习模型的目标函数为:
其中K表明该模型构造了K颗树yi为数据中第i个样本的真实值,为模型对第i个样本的预测值,可表示为其中fk是属于函数空间δ中的函数,而δ为所有回归树的集合,l表示数据集中第i个样本真实值与预测值的误差,为误差函数,Ω表示树第k个分支的复杂度,则为表示复杂度的函数,其值越小复杂度越低,泛化能力越强;
公式(1)中有两部分构成,分别保证了误差和复杂度,为使预测结果更加准确,对参数进行优化,在保证模型不变的同时,引入修正函数:
其中表示第t迭代更新中的模型预测,ft(xi)表示新引入的修正函数,可极大降低目标函数;
在第t+1次迭代过程中,将代入目标函数(1)中,可得
若函数l表征的是平方误差函数,则(3)式可进一步表示为
其中叫做残差;
如果函数l不是平方误差函数,目标函数可近似表示为
利用泰勒级数展开,可近似表示为
其中分别表示针对的一阶和二阶偏导;
把常数项移除之后,得到一个比较统一的目标函数,其只依赖于每个数据点在误差函数上的一阶导数和二阶导数,即
将目标函数进一步优化:
假设其叶子节点个数为T,该回归树是由所有叶子节点对应的值组成的向量w∈RT(R为训练样本)以及一个把特征向量映射到叶子节点索引的函数q:Rd→1,2,3,…,T组成的,因此,回归树可以定义为ft(x)=wq(x);
同时,回归树复杂度可以由正则项来定义,即该回归树模型的复杂度由生成的树的叶子节点数量和叶子节点对应的值向量的L2范数决定,其中I被定义为每个叶子节点上面样本集合Ij={i|q(xi)=j},该目标函数还包含了T个相互独立的单变量二次函数,分别定义和目标函数可以进一步改写成如下的形式:
若已知树结构q的先验信息,可以通过优化目标函数(8)来求解最优解w,从而使目标函数增益最大化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东农业大学,未经山东农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910715273.7/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





