[发明专利]一种基于大数据的中央空调能耗特征选择方法在审
| 申请号: | 201810730455.7 | 申请日: | 2018-07-05 |
| 公开(公告)号: | CN108921222A | 公开(公告)日: | 2018-11-30 |
| 发明(设计)人: | 李碧军;史翔;何彬;陈耕 | 申请(专利权)人: | 四川泰立智汇科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 梁田 |
| 地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 中央空调 能耗特征 大数据 算法 预处理 特征选择算法 能耗数据 交集 本质差异 关键特征 冗余问题 特征融合 特征选择 特征子集 影响研究 运行数据 专家意见 复杂度 特征集 回归 归类 子集 能耗 采集 创建 | ||
1.一种基于大数据的中央空调能耗特征选择方法,其特征在于,包括以下步骤:
步骤一、采用专家意见对特征数据集进行初步筛选;
步骤二、对经过初步筛选的特征数据集进行预处理;
步骤三、基于预处理后的特征集,采用boruta特征选择算法提取新的特征子集1;
步骤四、基于预处理后的特征集,采用lasso特征选择算法提取新的特征子集2;
步骤五、基于步骤三得到的特征子集1和步骤四得到的特征子集2,结合专家意见,采用交集归类的方法得到中央空调能耗关键特征集合。
2.根据权利要求1所述的一种基于大数据的中央空调能耗特征选择方法,其特征在于,所述步骤二的预处理具体包括以下步骤:
步骤2.1,设定约束范围,剔除异常值;
步骤2.2,使用决策树得到系统稳定条件下的运行数据;
步骤2.3,间隔5分钟取数据均值,去掉重复点;
步骤2.4,合并数据,并进行数据扩增;
步骤2.5,插值补充缺失数据。
3.根据权利要求1所述的一种基于大数据的中央空调能耗特征选择方法,其特征在于,所述步骤三中采用boruta特征选择算法提取新的特征子集1具体包括以下步骤:
步骤3.1,通过创建混合副本的阴影特征为给定的数据集增加随机性;
步骤3.2,训练一个随机森林分类的扩展数据集,以评估每个特征的重要性,越高则越重要;
步骤3.3,检查每一个原特征是否比最好的阴影特征具有更高的重要性,并且不断删除它视为非常不重要的特征;
步骤3.4,当所有特征得到确认或拒绝,或算法达到随机森林运行的一个规定的限制时,算法停止。
4.根据权利要求1所述的一种基于大数据的中央空调能耗特征选择方法,其特征在于,所述步骤四中采用lasso特征选择算法提取新的特征子集2具体采用模型系数的绝对值函数作为惩罚来压缩模型系数,将部分回归系数变小或设置为0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川泰立智汇科技有限公司,未经四川泰立智汇科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810730455.7/1.html,转载请声明来源钻瓜专利网。





