[发明专利]一种工控数据特征重排序算法的自适应确定方法有效
| 申请号: | 202110867814.5 | 申请日: | 2021-07-30 |
| 公开(公告)号: | CN113568368B | 公开(公告)日: | 2022-12-23 |
| 发明(设计)人: | 刘学君;孔祥旻;张小妮;沙芸;晏涌;王文晖;曹雪莹;李凯丽 | 申请(专利权)人: | 北京石油化工学院 |
| 主分类号: | G05B19/408 | 分类号: | G05B19/408 |
| 代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 鲍亚平 |
| 地址: | 102600 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据 特征 排序 算法 自适应 确定 方法 | ||
本发明涉及一种工控数据特征重排序算法的自适应确定方法,通过基于不同特征重排序算法对数据集进行特征选择;基于机器学习算法对重排序后的数据集进行训练记录准确率、召回率和时间,并对数据集计算预设评价指标,以生成相应的指标数据集合;对指标数据集合使用机器学习算法建立选择最优重排序算法的决策树;并使用决策树对输入的目标数据集的指标数据进行处理,以得到和目标数据集相匹配的特征重排序算法。实现了能够自动挑选出和目标数据集匹配度最好的特征重排序算法,从而提高了数据集特征重排序算法的准确度和效率,为工控数据的异常检测提供了保证。
技术领域
本发明属于数据安全技术领域,具体涉及一种工控数据特征重排序算法的自适应确定方法。
背景技术
在工控领域中,随着互联网技术的逐渐成熟,工控网络越来越多地与互联网相联通,这使得工控网络极易受到攻击。
现有针对工控数据实时监控的异常检测算法多采用机器学习算法和神经网络算法。但实际工控环境复杂在采集数据时存储顺序随机,采集到的数据维度间关联具有不确定性。如相邻维度可能是无关参数或无关设备,而相关设备或参数物理距离远等情况。以上这些问题加大了异常检测算法的学习难度,算法的学习效率有待进一步提高。而实际情况中存在不同的工控环境,采集到的数据集都不相同,为每个数据集寻找适用特征选择算法重复工作量大,实现同一类型的数据集直接匹配特征选择算法,去除重复运算也刻不容缓。
发明内容
为了解决现有技术存在的效率低的问题,本发明提供了一种工控数据特征重排序算法的自适应确定方法,其具有提高了数据集特征重排序的准确度和效率,为工控数据的异常检测提供了保证等特点。
根据本发明的具体实施方式的一种工控数据特征重排序算法的自适应确定方法,包括:
基于不同特征选择算法对数据集进行特征重排序;
基于机器学习算法对重排序后的数据集进行训练记录准确率、召回率和时间,并对数据集计算预设评价指标,以生成相应的指标数据集合;
基于所述指标数据集合使用机器学习算法建立选择最优重排序算法的决策树;
基于所述决策树对输入的目标数据集的指标数据进行判断,以得到和所述目标数据集相匹配的特征重排序算法。
进一步的,基于机器学习算法对重排序后的数据集进行训练记录Acc、Recall和时间,并对数据集计算预设评价指标,以生成相应的指标数据集合包括:
基于预设数据集相关参数对数据集进行计算,基于特征选择结果参数对特征选择结果进行计算以生成所述指标数据集合。
进一步的,所述数据集相关参数包括:数据集维度、分类数量、各类数据量分布不平衡度、KL散度、数据拟合度、方差和方差膨胀系数。
进一步的,所述特征选择结果参数包括特征选择数量和特征评分分布不平衡度。
进一步的,所述基于所述指标数据集合使用机器学习算法建立选择最优重排序算法的决策树包括:
分别计算根据每个特征划分所述指标数据集合后的信息熵,并选择信息增益最大的特征作为数据划分节点来划分所述指标数据集合;
递归处理被划分后的所有子数据集,以选择出最优数据划分特征来划分子数据集。
进一步的,所述基于所述指标数据集合使用机器学习算法建立选择最优重排序算法的决策树还包括:
对所述决策树进行剪枝以提高所述决策树的分类速度和分类精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京石油化工学院,未经北京石油化工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110867814.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





