[发明专利]新能源使用行为的时序特征隐含因素抽取和刻画方法及系统有效
申请号: | 201910444301.6 | 申请日: | 2019-05-27 |
公开(公告)号: | CN110263069B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 姚俊杰;黄嘉祥;王江涛;郭羽翟 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28;G06Q10/04 |
代理公司: | 上海德禾翰通律师事务所 31319 | 代理人: | 夏思秋 |
地址: | 200062 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 新能源 使用 行为 时序 特征 隐含 因素 抽取 刻画 方法 系统 | ||
1.一种新能源使用行为的时序特征隐含因素抽取和刻画方法,其特征在于,包括:
步骤A:获取用户使用情况的原始数据;
步骤B:通过计算原始数据各项统计指标,设定筛选用于特征提取的原始数据的标准;设定的标准是对记录丢失率为80%以上的原始数据进行筛去,再通过均值、补零、回归方法对剩余的原始数据中的缺失值进行填补;
步骤C:对时间序列数据进行归一化处理和特征抽取,具体包括以下步骤:
步骤C1:将原始数据转换为随时间变化的各站点利用率的时间序列数据;其中,通过程序,批量的对原始数据进行计算和转换;所述程序流程为按时间戳依次扫描初步清洗后的原始数据,统计按小时、天、周时间长度为单位的站点利用率情况,从而得到以某时间长度为基本单位的时间序列数据;
步骤C2:转换完毕的时间序列数据,对各站点的时间序列数据进行平滑;其中,采用滑动平均法,以降低极端值特殊情况对特征提取时的影响;
步骤C3:对平滑后的每个时刻的时间序列数据打上分类标签;其中,按三分位数将利用率情况进一步划分为低、中、高三类,以增强最后的特征提取效果,完成所述时间序列数据的抽取工作;
步骤C4:以较大的时间长度为单位,将时间序列数据转换为长度为24小时的时间序列数据;
步骤D:基于聚类算法进行隐含的特征表示;其中,聚类方法选用k-Spectral Centroid算法,首先将时间序列按峰值对齐,然后补全或平移部分时间序列数据,使各时序等长,最后采用谱聚类的方式计算k个聚类中心;具体包括以下步骤:
步骤D1:对于抽取并完成数据转换的时间序列数据,采用聚类方法进行模式识别,得到具有明显特征的时序聚类中心;
步骤D2:通过时序聚类中心来描绘各站点的使用行为;
步骤E:基于隐含的特征表示,形成对使用行为的刻画;其中,计算方法为首先统计各站点时间序列数据记录条数然后统计属于某一个类别的总数,则该类别所占比例即为该类别所占记录条数/总记录条数*100%;具体包括以下步骤:
步骤E1:根据聚类结果,计算各站点的时间序列数据在各类别所占比例;
步骤E2:将统计得到的比例以站点为单位组成向量,即是描述对应站点使用行为的隐含因素。
2.一种新能源使用行为的时序特征隐含因素抽取和刻画系统,其特征在于,采用如权利要求1所述的方法,所述系统包括:
数据获取模块,用于获取用户使用情况的原始数据;
数据清洗及抽取模块,通过计算原始数据各项统计指标,设定用于筛选用于特征提取的原始数据的标准;
时间序列数据预处理模块,用于对时间序列数据预处理;
时序数据聚类模块,对于抽取并完成数据转换的时间序列数据,采用聚类方法进行模式识别,得到具有明显特征的时序聚类中心,即时间序列数据中具有标志性的时间序列;
新特征产生模块,计算各站点的时间序列数据在各类别所占比例,将其组成为向量,即是抽取得到的刻画使用行为的隐含因素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910444301.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种处理监控数据的方法及系统
- 下一篇:事件上报方法及装置