[发明专利]基于决策树与神经网络的水产养殖病害预测方法及系统有效
| 申请号: | 201911113206.4 | 申请日: | 2019-11-14 |
| 公开(公告)号: | CN111062511B | 公开(公告)日: | 2023-04-25 |
| 发明(设计)人: | 姜春涛;黄昕;任紫薇;凌逸文;罗戬浩;曹颖;潘淑仪 | 申请(专利权)人: | 佛山科学技术学院 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/02;G06F18/2431;G06F18/214;G06N5/01;G06N3/0442;G06N3/048;G06N3/084 |
| 代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 蔡伟杰 |
| 地址: | 528000 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 决策树 神经网络 水产 养殖 病害 预测 方法 系统 | ||
1.基于决策树与神经网络的水产养殖病害预测方法,其特征在于,所述方法包括以下步骤:
步骤一:数据采集;
步骤二:生成决策树;
步骤三:采集处理后的数据;
步骤四:标准化处理数据;
步骤五:划分数据;
步骤六:设置输入、输出层;
步骤七:隐藏层参数设置;
步骤八:构建长短期记忆循环神经网络;
步骤九:训练长短期记忆循环神经网络模型;
步骤十:将预测出的各因素的数据组合成一组一组的数据,代入建立好的决策树中进行分类预测水产病害的爆发;
在步骤二中,生成决策树的方法为:
去除相关性大的属性:
步骤2.1,利用公式(1)计算两两因素之间的相关系数:
(1);
其中x、y为两个因素,、分别为两个因素所有数据的平均值,为数据总数;当p达到0.95时,则认为两个因素相关性过大,此时分别判断这两个因素对病害爆发的影响大小,剔除影响力较小的因素;
步骤2.2,分裂属性的选择:
利用公式(2)计算对L分类所需要的期望信息:
(2);
其中,m为数据集中水产疾病的种类数量,为对应疾病在数据集中出现的概率;
利用公式(3)计算因素xi的分裂信息:
(3);
其中,训练集L通过因素xi的属性值划分为m个子数据聚集,表示第j个子数据聚集中样本数量,表示划分之前数据集中样本总数量;
利用公式(4)、(5)计算因素xi的信息增益率:
(4);
(5);
步骤2.3,采用PEP剪枝法进行因素的选择最终确定因素个数y;
在步骤六中,设置输入、输出层的方法为:
设置网络输入为每次每个因素的35条数据作为输入,
,3个数据作为输出,网络经过训练会输出接下来连续3个时间段各因素含量的预测值;
在步骤八中,构建长短期记忆循环神经网络的方法为:
构建长短期记忆循环神经网络:
(7)
(8)
(9)
(10)
(11)
式中:为输入门限层(input gate);为遗忘门限层(forget gate);为输出门限层(output gate);为记忆细胞在t时刻的状态;为输入层的输入向量;为隐藏层的输出向量,为t-1时刻隐藏层的输出向量;是指矩阵逐元素点乘;是各层输出的偏差向量,如是输入门限层的偏差向量,是遗忘门限层的偏差向量,是输出门限层的偏差向量,是记忆细胞的偏差向量;是ELU函数;是对应层的权重矩阵,如是输入层到遗忘门限层的权重矩阵,是隐藏层到遗忘门限层的权重矩阵,是输入层到输入门限层的权重矩阵、是输入层到输出门限层的权重矩阵、是隐藏层到输出门限层的权重矩阵、是隐藏层到输入门限层的权重矩阵、是隐藏层到记忆细胞的权重矩阵;用于更新细胞状态;由式(10)可知遗忘门控制有多少上一时刻的记忆细胞中的信息可以传输到当前时刻的记忆细胞中;输入门控制有多少信息可以流入记忆细胞中;而输出门控制有多少当前时刻的记忆细胞中的信息可以流入当前隐藏层中;
在步骤九中,训练长短期记忆循环神经网络模型的方法为:
训练长短期记忆循环神经网络模型:将数据代入模型进行训练过程中,由小批量梯度下降法寻找使预测值与真实值相差最小的值,提高模型的精确度;确定先决条件即确定优化模型的假设函数及损失函数见公式(12)其中为模型预测值,为真实值,为数据总数,通过计算找出最合适的LSTM神经网络中的权重;
(12)。
2.根据权利要求1所述的基于决策树与神经网络的水产养殖病害预测方法,其特征在于,在步骤四中,标准化处理数据的方法为:
利用min-max标准化公式(6)分别将的r行数据归一化:
(6);
其中,为第i个因素的所有数据的最大值,为第i个因素的最小值。
3.基于决策树与神经网络的水产养殖病害预测系统,其特征在于,所述系统包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下系统的单元中:
数据采集单元,用于数据采集;
生成决策树单元,用于生成决策树;
数据采集再单元,用于采集处理后的数据;
标准化单元,用于标准化处理数据;
划分数据单元,用于划分数据;
输入输出设置单元,用于设置输入、输出层;
隐藏层单元,用于隐藏层参数设置;
网络构建单元,用于构建长短期记忆循环神经网络;
网络训练单元,用于训练长短期记忆循环神经网络模型;
预测单元,用于将预测出的各因素的数据组合成一组一组的数据,代入建立好的决策树中进行分类预测水产病害的爆发;
生成决策树的方法为:
去除相关性大的属性:
利用公式(1)计算两两因素之间的相关系数:
(1);
其中x、y为两个因素,、分别为两个因素所有数据的平均值,为数据总数;当p达到0.95时,则认为两个因素相关性过大,此时分别判断这两个因素对病害爆发的影响大小,剔除影响力较小的因素;
分裂属性的选择:
利用公式(2)计算对L分类所需要的期望信息:
(2);
其中,m为数据集中水产疾病的种类数量,为对应疾病在数据集中出现的概率;
利用公式(3)计算因素xi的分裂信息:
(3);
其中,训练集L通过因素xi的属性值划分为m个子数据聚集,表示第j个子数据聚集中样本数量,表示划分之前数据集中样本总数量;
利用公式(4)、(5)计算因素xi的信息增益率:
(4);
(5);
采用PEP剪枝法进行因素的选择最终确定因素个数y;
设置输入、输出层的方法为:
设置网络输入为每次每个因素的35条数据作为输入,
,3个数据作为输出,网络经过训练会输出接下来连续3个时间段各因素含量的预测值;
构建长短期记忆循环神经网络的方法为:
构建长短期记忆循环神经网络:
(7)
(8)
(9)
(10)
(11)
式中:为输入门限层(input gate);为遗忘门限层(forget gate);为输出门限层(output gate);为记忆细胞在t时刻的状态;为输入层的输入向量;为隐藏层的输出向量,为t-1时刻隐藏层的输出向量;是指矩阵逐元素点乘;是各层输出的偏差向量,如是输入门限层的偏差向量,是遗忘门限层的偏差向量,是输出门限层的偏差向量,是记忆细胞的偏差向量;是ELU函数;是对应层的权重矩阵,如是输入层到遗忘门限层的权重矩阵,是隐藏层到遗忘门限层的权重矩阵,是输入层到输入门限层的权重矩阵、是输入层到输出门限层的权重矩阵、是隐藏层到输出门限层的权重矩阵、是隐藏层到输入门限层的权重矩阵、是隐藏层到记忆细胞的权重矩阵;用于更新细胞状态;由式(10)可知遗忘门控制有多少上一时刻的记忆细胞中的信息可以传输到当前时刻的记忆细胞中;输入门控制有多少信息可以流入记忆细胞中;而输出门控制有多少当前时刻的记忆细胞中的信息可以流入当前隐藏层中;
训练长短期记忆循环神经网络模型的方法为:
训练长短期记忆循环神经网络模型:将数据代入模型进行训练过程中,由小批量梯度下降法寻找使预测值与真实值相差最小的值,提高模型的精确度;确定先决条件即确定优化模型的假设函数及损失函数见公式(12)其中为模型预测值,为真实值,为数据总数,通过计算找出最合适的LSTM神经网络中的权重;
(12)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911113206.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种中高温热泵混合工质
- 下一篇:一种网络请求处理方法及系统
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





