[发明专利]基于工业大数据产品工期的约束条件分析系统与方法有效
| 申请号: | 201810086663.8 | 申请日: | 2018-01-30 |
| 公开(公告)号: | CN108491991B | 公开(公告)日: | 2021-08-06 |
| 发明(设计)人: | 常建涛;孔宪光;林松涛;罗才文 | 申请(专利权)人: | 西安电子科技大学 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/04;G06K9/62;G06F16/215 |
| 代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;王品华 |
| 地址: | 710071 陕*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 工业 数据 产品 工期 约束条件 分析 系统 方法 | ||
1.一种基于工业大数据产品工期的约束条件分析系统,其特征在于,该系统是在Spark大数据分析平台上构建的系统;该系统包括数据存储模块、数据预处理模块、模型训练模块、产品工期约束条件重要度输出模块;其中:
所述的数据存储模块,用于存储产品的订单数据、原料采购数据、加工过程数据、产品工艺评价数据、生产过程机器工作状态数据、机器故障停机数据、工作人员工作记录数据以及工期数据;
所述的数据预处理模块用于对数据存储模块中的数据缺失的部分进行平均数填充处理,采用3σ原则进行异常值剔除处理,将数据存储模块中的数据除工期数据外的剩余数据进行归一化处理,得到预处理数据;
所述的模型训练模块包括随机森林重要度约束条件筛选模型、主成分特征提取模型、约束条件组合模型、K-means聚类方法筛选非线性约束条件模型、约束条件随机选择模型、误差分析模型;其中:随机森林重要度约束条件筛选模型,用于对约束条件进行筛选,得到重要约束条件数据集;主成分特征提取模型,用于提取预处理后的数据的主要特征,得到线性约束条件数据集;约束条件组合模型,用于将预处理后的数据对应的约束条件进行组合,得到所有的非线性约束条件;K-means聚类方法筛选组合约束条件模型,用于筛选非线性约束条件,得到非线性约束条件数据集;约束条件随机选择模型,用于随机选择线性约束条件数据集和非线性约束条件数据集组成的组合约束条件数据集,得到随机组合约束条件数据集;误差分析模型,用于计算产品的预测工期与实际工期的误差值;
所述的产品工期约束条件重要度输出模块,将模型训练模块得到的多元线性回归的所有系数和对应的随机组合约束条件或重要约束条件,对所有系数的绝对值降序排列,依次得到对应的重要约束条件或随机组合约束条件的重要度,并且将结果保存到HDFS分布式文件系统并封装成Spark平台上的接口,以API的形式提供应用链接。
2.一种基于工业大数据产品工期的约束条件分析方法,其特征在于,该方法是在工业大数据产品工期的约束条件分析系统上,利用产品在工业中长期积累产生的大量数据,对产品工期的约束条件进行分析,具体步骤包括如下:
(1)构建原始数据表:
收集离散制造型产品在工业中长期积累产生的大量数据,将收集到的数据根据加工批次顺序合并,构建一个原始数据表;
(2)对数据进行预处理:
(2a)对原始数据表中数据缺失的部分进行平均数填充处理,采用3σ原则进行异常值剔除处理,得到待处理数据;
(2b)将待处理数据中除工期数据外的剩余数据进行归一化处理,得到预处理后的数据;
(3)组成重要约束条件数据集:
(3a)在[0,1]的范围内设定随机森林重要度得分的阈值;
(3b)利用随机森林重要度分析法,计算每个约束条件的重要度得分;
(3c)对所有重要度得分的绝对值按照降序排列,将排第一的重要度得分的绝对值对应的约束条件筛选出来,并从所有的约束条件中删除该约束条件;
(3d)判断排列第一的重要度得分的绝对值是否小于阈值,若是,则执行步骤(3e),否则,执行步骤(3b);
(3e)将所有筛选出的约束条件对应的数据,按列合并,组成重要约束条件数据集;
(4)提取约束条件特征:
利用主成分分析方法,提取预处理后数据中的主要特征,将每一个主要特征对应的数据组合成一个线性约束条件,将所有线性约束条件数据,按列合并,组成线性约束条件数据集;
(5)组合约束条件:
(5a)采用放回抽样方法,从预处理后的数据对应的约束条件中,分2次抽取约束条件,列出2次抽取的约束条件的排列组合;
(5b)每种排列组合对应的约束条件的数据对应相乘后得到一个非线性约束条件,计算出所有的非线性约束条件;
(6)筛选非线性约束条件:
(6a)运用K-means聚类方法,对所有非线性约束条件进行聚类处理;
(6b)从每一个聚类中选择出一个距离聚类中心点距离最近的非线性约束条件;
(6c)将选择出的所有非线性约束条件对应的数据,按列合并,组成非线性约束条件数据集;
(7)随机选择组合约束条件:
(7a)将线性约束条件数据集和非线性约束条件数据集,按列合并,组成组合约束条件数据集;
(7b)统计组合约束条件的总数,用0表示不选中组合约束条件,用1表示选中组合约束条件,将选中的组合约束条件对应的数据,按列合并,组成随机组合约束条件数据集;
(8)误差分析:
(8a)将随机组合约束条件数据集、重要约束条件数据集与工期数据,按列合并,并将合并后的数据按照3:1的比例随机划分为训练数据和测试数据;
(8b)运用最小二乘法,利用训练数据建立预测工期的多元线性回归模型;
(8c)将测试数据除工期外的数据输入多元线性回归模型,输出工期的预测值;
(8d)运用相对均方根误差公式,计算工期预测数据与测试数据里的工期数据的误差值;
(8e)将步骤(8a)、步骤(8b)、步骤(8c)、步骤(8d)重复10次,计算10次误差的平均值;
(9)判定10次误差的平均值是否小于误差指标值,若是,则执行步骤(10),否则,执行步骤(7);
(10)输出结果:
输出多元线性回归模型的所有系数和对应的随机组合约束条件和重要约束条件,对所有系数的绝对值降序排列,依次得到对应的重要约束条件或随机组合约束条件的重要度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810086663.8/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





