[发明专利]基于决策树与神经网络的水产养殖病害预测方法及系统有效

专利信息
申请号: 201911113206.4 申请日: 2019-11-14
公开(公告)号: CN111062511B 公开(公告)日: 2023-04-25
发明(设计)人: 姜春涛;黄昕;任紫薇;凌逸文;罗戬浩;曹颖;潘淑仪 申请(专利权)人: 佛山科学技术学院
主分类号: G06Q10/04 分类号: G06Q10/04;G06Q50/02;G06F18/2431;G06F18/214;G06N5/01;G06N3/0442;G06N3/048;G06N3/084
代理公司: 广州嘉权专利商标事务所有限公司 44205 代理人: 蔡伟杰
地址: 528000 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 决策树 神经网络 水产 养殖 病害 预测 方法 系统
【权利要求书】:

1.基于决策树与神经网络的水产养殖病害预测方法,其特征在于,所述方法包括以下步骤:

步骤一:数据采集;

步骤二:生成决策树;

步骤三:采集处理后的数据;

步骤四:标准化处理数据;

步骤五:划分数据;

步骤六:设置输入、输出层;

步骤七:隐藏层参数设置;

步骤八:构建长短期记忆循环神经网络;

步骤九:训练长短期记忆循环神经网络模型;

步骤十:将预测出的各因素的数据组合成一组一组的数据,代入建立好的决策树中进行分类预测水产病害的爆发;

在步骤二中,生成决策树的方法为:

去除相关性大的属性:

步骤2.1,利用公式(1)计算两两因素之间的相关系数:

 (1);

其中x、y为两个因素,、分别为两个因素所有数据的平均值,为数据总数;当p达到0.95时,则认为两个因素相关性过大,此时分别判断这两个因素对病害爆发的影响大小,剔除影响力较小的因素;

步骤2.2,分裂属性的选择:

利用公式(2)计算对L分类所需要的期望信息:

(2);

其中,m为数据集中水产疾病的种类数量,为对应疾病在数据集中出现的概率;

利用公式(3)计算因素xi的分裂信息:

(3);

其中,训练集L通过因素xi的属性值划分为m个子数据聚集,表示第j个子数据聚集中样本数量,表示划分之前数据集中样本总数量;

利用公式(4)、(5)计算因素xi的信息增益率:

 (4);

(5);

步骤2.3,采用PEP剪枝法进行因素的选择最终确定因素个数y;

在步骤六中,设置输入、输出层的方法为:

设置网络输入为每次每个因素的35条数据作为输入,

,3个数据作为输出,网络经过训练会输出接下来连续3个时间段各因素含量的预测值;

在步骤八中,构建长短期记忆循环神经网络的方法为:

构建长短期记忆循环神经网络:

(7)

(8)

(9)

 (10)

(11)

式中:为输入门限层(input gate);为遗忘门限层(forget gate);为输出门限层(output gate);为记忆细胞在t时刻的状态;为输入层的输入向量;为隐藏层的输出向量,为t-1时刻隐藏层的输出向量;是指矩阵逐元素点乘;是各层输出的偏差向量,如是输入门限层的偏差向量,是遗忘门限层的偏差向量,是输出门限层的偏差向量,是记忆细胞的偏差向量;是ELU函数;是对应层的权重矩阵,如是输入层到遗忘门限层的权重矩阵,是隐藏层到遗忘门限层的权重矩阵,是输入层到输入门限层的权重矩阵、是输入层到输出门限层的权重矩阵、是隐藏层到输出门限层的权重矩阵、是隐藏层到输入门限层的权重矩阵、是隐藏层到记忆细胞的权重矩阵;用于更新细胞状态;由式(10)可知遗忘门控制有多少上一时刻的记忆细胞中的信息可以传输到当前时刻的记忆细胞中;输入门控制有多少信息可以流入记忆细胞中;而输出门控制有多少当前时刻的记忆细胞中的信息可以流入当前隐藏层中;

在步骤九中,训练长短期记忆循环神经网络模型的方法为:

训练长短期记忆循环神经网络模型:将数据代入模型进行训练过程中,由小批量梯度下降法寻找使预测值与真实值相差最小的值,提高模型的精确度;确定先决条件即确定优化模型的假设函数及损失函数见公式(12)其中为模型预测值,为真实值,为数据总数,通过计算找出最合适的LSTM神经网络中的权重;

(12)。

2.根据权利要求1所述的基于决策树与神经网络的水产养殖病害预测方法,其特征在于,在步骤四中,标准化处理数据的方法为:

利用min-max标准化公式(6)分别将的r行数据归一化:

 (6);

其中,为第i个因素的所有数据的最大值,为第i个因素的最小值。

3.基于决策树与神经网络的水产养殖病害预测系统,其特征在于,所述系统包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下系统的单元中:

数据采集单元,用于数据采集;

生成决策树单元,用于生成决策树;

数据采集再单元,用于采集处理后的数据;

标准化单元,用于标准化处理数据;

划分数据单元,用于划分数据;

输入输出设置单元,用于设置输入、输出层;

隐藏层单元,用于隐藏层参数设置;

网络构建单元,用于构建长短期记忆循环神经网络;

网络训练单元,用于训练长短期记忆循环神经网络模型;

预测单元,用于将预测出的各因素的数据组合成一组一组的数据,代入建立好的决策树中进行分类预测水产病害的爆发;

生成决策树的方法为:

去除相关性大的属性:

利用公式(1)计算两两因素之间的相关系数:

 (1);

其中x、y为两个因素,、分别为两个因素所有数据的平均值,为数据总数;当p达到0.95时,则认为两个因素相关性过大,此时分别判断这两个因素对病害爆发的影响大小,剔除影响力较小的因素;

分裂属性的选择:

利用公式(2)计算对L分类所需要的期望信息:

(2);

其中,m为数据集中水产疾病的种类数量,为对应疾病在数据集中出现的概率;

利用公式(3)计算因素xi的分裂信息:

(3);

其中,训练集L通过因素xi的属性值划分为m个子数据聚集,表示第j个子数据聚集中样本数量,表示划分之前数据集中样本总数量;

利用公式(4)、(5)计算因素xi的信息增益率:

 (4);

(5);

采用PEP剪枝法进行因素的选择最终确定因素个数y;

设置输入、输出层的方法为:

设置网络输入为每次每个因素的35条数据作为输入,

,3个数据作为输出,网络经过训练会输出接下来连续3个时间段各因素含量的预测值;

构建长短期记忆循环神经网络的方法为:

构建长短期记忆循环神经网络:

(7)

(8)

(9)

 (10)

(11)

式中:为输入门限层(input gate);为遗忘门限层(forget gate);为输出门限层(output gate);为记忆细胞在t时刻的状态;为输入层的输入向量;为隐藏层的输出向量,为t-1时刻隐藏层的输出向量;是指矩阵逐元素点乘;是各层输出的偏差向量,如是输入门限层的偏差向量,是遗忘门限层的偏差向量,是输出门限层的偏差向量,是记忆细胞的偏差向量;是ELU函数;是对应层的权重矩阵,如是输入层到遗忘门限层的权重矩阵,是隐藏层到遗忘门限层的权重矩阵,是输入层到输入门限层的权重矩阵、是输入层到输出门限层的权重矩阵、是隐藏层到输出门限层的权重矩阵、是隐藏层到输入门限层的权重矩阵、是隐藏层到记忆细胞的权重矩阵;用于更新细胞状态;由式(10)可知遗忘门控制有多少上一时刻的记忆细胞中的信息可以传输到当前时刻的记忆细胞中;输入门控制有多少信息可以流入记忆细胞中;而输出门控制有多少当前时刻的记忆细胞中的信息可以流入当前隐藏层中;

训练长短期记忆循环神经网络模型的方法为:

训练长短期记忆循环神经网络模型:将数据代入模型进行训练过程中,由小批量梯度下降法寻找使预测值与真实值相差最小的值,提高模型的精确度;确定先决条件即确定优化模型的假设函数及损失函数见公式(12)其中为模型预测值,为真实值,为数据总数,通过计算找出最合适的LSTM神经网络中的权重;

(12)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911113206.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top