[发明专利]信息反馈极限学习机优化估值的缺失数据模糊聚类算法及其应用有效
申请号: | 201710992778.9 | 申请日: | 2017-10-23 |
公开(公告)号: | CN107729943B | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 张利;刘洋;高欣;潘辉;王军;赵中洲 | 申请(专利权)人: | 辽宁大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 沈阳杰克知识产权代理有限公司 21207 | 代理人: | 罗莹 |
地址: | 110136 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息反馈 极限 学习机 优化 缺失 数据 模糊 算法 及其 应用 | ||
本发明涉及信息反馈极限学习机优化估值的缺失数据模糊聚类算法及其应用,基本步骤如下:1)采用互信息计算并选择相关度较高的数据属性,依据这些属性选择不完备数据中的完备数据作为FELM网络的训练样本;2)初始化FELM网络的输入权值ω以及偏置值b;3)根据最近邻规则对缺失属性进行预填充,并根据训练样本训练FELM网络得到的误差对预填充值进行调整直至找到合理的数值进行填补,进而得到恢复后的完整数据集;4)初始化模糊C均值算法的参数,聚类数目c,模糊系数m,阈值ε及隶属度划分矩阵U(0);5)通过迭代优化模糊C均值算法的隶属度划分矩阵U和聚类中心V得到最终的聚类结果。运用本方法能够充分利用数据样本及属性之间的关联性和完整数据样本及不完备数据样本的分布信息来得到更加合理的属性估值,从而使不完备数据集的聚类结果更加准确。
技术领域
本发明涉及一种信息反馈极限学习机优化估值的缺失数据模糊聚类算法及其应用,属于工业信息化技术。
背景技术
钢材是我国建设以及实现四化不可或缺的重要物资,钢铁产业是一个国家发展的基础,建国六十多年来,中国带钢行业保持稳健、高速的发展,已建成工业化带钢技术体系。目前,中国处于工业发展的重要阶段,钢材的需求量仍旧巨大。对于钢铁行业来说,其面临着十分大的市场空间。如何针对现有带钢生产线进行创新性改造,减量化以及低碳化生产出高质量、高效益、高水平的钢材是一个具有现实意义的问题。现阶段,信息化是覆盖现代化全局的战略性举措,钢铁工业想要进一步创新改造就要充分结合信息化技术,把信息化产业的先进技术充分融于钢铁轧制过程,全面实现工业信息化协同发展。因此,针对带钢数据进行聚类分析,通过分析结果强化工业化生产改革是极其重要的。
近年来,聚类分析适合对众多不同类型的数据集合。在很多研究领域取得了广泛的应用与发展。根据带钢数据自身的属性,依照某种相似性或差异性度量使用数学方法去确定带钢数据样本之间的亲属关系,并对这种关系进行聚类分析从而使用分析结果调节生产线是一件有意义的事情。但是,由于现实的生产生活中受多因素的影响:例如数据采集设备的故障、存储介质的故障、传输媒体出现的故障、人为因素的疏漏或者是探测仪器的受限等等。收集到的数据集存在不完备现象,而传统的聚类方法对不完备的数据集是不能直接应用的。因此,选择一种恰当的方式对不完备数据进行处理,对最终结果的分析及未来工业计划的制定是极为重要的。
发明内容
为了解决上述问题,本发明提供一种信息反馈极限学习机优化估值的缺失数据模糊聚类算法,并将其应用于对带钢数据的分析中,通过分析结果强化工业化生产改革。
本发明是通过下述技术方案实现的:信息反馈极限学习机优化估值的缺失数据模糊聚类算法,其特征在于,步骤如下:
1)采用互信息计算并选择相关度较高的数据属性,依据这些属性选择不完备数据中的完备数据作为FELM网络的训练样本;
其中,μX(x)表示变量X的边缘概率密度函数;μY(y)表示变量Y的边缘概率密度函数;μXY(x,y)表示变量之间联合概率密度函数;
2)对FELM网络参数确定:初始化输入权值ω以及偏置值b;ω和b的初始化值设置在区间[-1,1]之间,随机选取该区间的任意随机数对网络进行初始化,确定极限学习机的隐藏层节点数;
3)根据最近邻规则对缺失属性进行预填充,并根据训练样本训练FELM网络得到的误差采用误差检索法对预填充值进行调整直至找到合理的数值进行填补,进而得到恢复后的完整数据集;
4)初始化模糊C均值算法的参数,聚类数目c,模糊系数m,阈值ε及隶属度划分矩阵U(0);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁大学,未经辽宁大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710992778.9/2.html,转载请声明来源钻瓜专利网。