[发明专利]基于环保大数据的自动分析判别方法在审
| 申请号: | 202110516775.4 | 申请日: | 2021-05-12 |
| 公开(公告)号: | CN113159448A | 公开(公告)日: | 2021-07-23 |
| 发明(设计)人: | 孙元晓;周轶文;刘军胜;司梦晨;王大伟 | 申请(专利权)人: | 烟台应辉智能科技有限公司 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/26;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京中创博腾知识产权代理事务所(普通合伙) 11636 | 代理人: | 孙福岭 |
| 地址: | 264006 山东省烟*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 环保 数据 自动 分析 判别 方法 | ||
1.基于环保大数据的自动分析判别方法,其特征在于:包括如下步骤:
S1、设计自动分析识别方法,对工业产值与污染物排放数据进行整理;
S2、对工业产值数据进行预测判别;
S3、对污染物排放数据进行预测判别。
2.根据权利要求1所述的基于环保大数据的自动分析判别方法,其特征在于:所述S1中,自动分析识别方法包括如下步骤:
S1.1、通过原始环保大数据数据库,剔除明显有误的数据,根据数据来源及工厂种类进行划分与初始计算;
S1.2、根据分类好的数据与初始计算结果,训练一个弱分类器并训练数据筛选网络,通过筛选后的数据训练一个强分类器,对弱分类器与强分类器的分类结果与实际上报数据的误差进行加权融合,并根据阈值输出置信度;
S1.3、根据S1.2的判别结果,在剔除工业产值为伪的数据后,通过现有的真实数据训练神经网络预测模型,并根据连续三年的相关污染物排放数据预测今年的污染物排放占比,并根据阈值输出置信度;
S1.4、结合S1.2与S1.3的判别结果,输出整合后的判别结果。
3.根据权利要求2所述的基于环保大数据的自动分析判别方法,其特征在于:所述S1.1中,剔除明显有误的数据采用信息量的熵算法,其计算公式为:
H(x)=-∑P(Xi)log2P(Xi);
其中,i=1,2,3,...,n,Xi表示第i个状态(共n个状态),P(Xi)代表出现第i个状态时的概率,H(x)为消除不确定性所需的信息量,单位为比特(bit)。
4.根据权利要求1所述的基于环保大数据的自动分析判别方法,其特征在于:所述S2中,对工业产值数据进行预测判别的方法包括如下步骤:
S2.1、根据上报的工厂种类对数据类别进行划分,计算连续三年的工业产值增加/下降百分比,并根据规则剔除明显有误的数据,完成数据的预处理;
S2.2、通过数据筛选网络,通过大数据挖掘出近几年该类工厂的发展趋势,根据整体趋势剔除违背整体发展趋势的数据;
S2.3、通过S2.2剔除部分置信度较低的数据,在剩余数据集的基础上训练一个强分类器,强分类器网络结构与损失函数同数据筛选网络;
S2.4、在S2.1分类好的基础上训练一个弱分类器,该分类器网络结构、损失函数与数据的输入输出同S2.1分数据筛选网络,不同的是训练的迭代次数大于数据筛选网络;
S2.5、在S2.3与S2.4的基础上,对其与真实值的差异进行加权,计算出最终的差异,并根据误差阈值进行工业总产值的数据真伪性判别。
5.根据权利要求1所述的基于环保大数据的自动分析判别方法,其特征在于:所述S2.2中,数据筛选网络由3个全连接层构成,输入维度为3*1,输出为1*1,将核实过的真实数据计算连续三年的工业产值增加/下降百分比作为神经网络的输入特征,将计算今年上报的工业总产值的增长/下降百分比作为神经网络的输出的标签,针对不同类型的工厂数据进行简单的预训练,损失函数采用MSE,预训练好的网络即为数据筛选网络,根除输出与真实值的误差剔除部分置信度较低的数据。
6.根据权利要求5所述的基于环保大数据的自动分析判别方法,其特征在于:所述S2.2中,MSE函数的计算表达式如下:
7.根据权利要求4所述的基于环保大数据的自动分析判别方法,其特征在于:所述S2.5中,通过对真实值的差异进行加权,计算出最终的差异的计算表达式如下:
ErrorTotal=λErrorStrong+(1-λ)ErrorWeak;
其中,λ设为0.2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于烟台应辉智能科技有限公司,未经烟台应辉智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110516775.4/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





