[发明专利]一种低压台区户变关系识别方法和系统在审
| 申请号: | 201811038149.3 | 申请日: | 2018-09-06 |
| 公开(公告)号: | CN109344144A | 公开(公告)日: | 2019-02-15 |
| 发明(设计)人: | 葛得辉;黄昌宝;李云峰;郑英刚 | 申请(专利权)人: | 葛得辉;中能瑞通(北京)科技有限公司 |
| 主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/332 |
| 代理公司: | 北京知呱呱知识产权代理有限公司 11577 | 代理人: | 武媛;吕学文 |
| 地址: | 100053 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 电压数据 低压台区 地址数据 关系识别 源数据 清洗 用户信息采集 档案数据 电力企业 电流数据 工作难度 数据清洗 数据校验 台区识别 有效解决 线损 分析 | ||
1.一种低压台区户变关系识别方法,其特征在于,包括:
从用户信息采集系统中获取至少包括档案数据、电压数据和电流数据中的一项或多项的源数据;
对所述源数据进行数据清洗,得到清洗后数据;
从所述清洗后数据中获取能够表征户变关系的用电地址数据和电压数据,并根据所述用电地址数据和所述电压数据进行台区识别,得到相应的识别结果;
对得到各识别结果进行数据校验。
2.根据权利要求1所述的方法,其特征在于,
所述档案数据至少包括以下一项:
表计或用户的台区编号、用电地址;或者,
所述电压数据为最近更新时间的每天96点电压曲线数据;或者,
所述电流数据为最新更新时间的每天96点电流曲线数据。
3.根据权利要求1所述的方法,其特征在于,所述对所述源数据进行数据清洗具体包括:
对所述源数据的缺失值进行缺失值补全;或者,
若所述电压数据或所述电流数据产生异常,则对所述源数据进行异常值处理;或者,
若所述源数据中有重复数据,则对所述源数据进行数据去重的处理。
4.根据权利要求3所述的方法,其特征在于,所述对所述源数据的缺失值进行缺失值补全具体包括:
若缺失值为所述源数据的重要数据,则对该缺失值进行补全;或者,
对于所述源数据中的运行数据通过相邻值和/或临近天同时刻的数值进行补全;或者,
若所述源数据对应的缺失数据为一天的全部缺失数据,则对该缺失数据不进行补全;或者,
若所述源数据对应的缺失数据为档案信息缺失数据,则通过人工核对的方式进行补全。
5.根据权利要求1所述的方法,其特征在于,所述根据所述用电地址数据和所述电压数据进行台区识别分析具体包括:
根据所述用电地址数据进行相应的用电地址识别;
根据所述电压数据进行台区识别。
6.根据权利要求5所述的方法,其特征在于,所述根据所述用电地址数据进行相应的用电地址识别具体包括:
选取所述档案数据中的用电地址;
对所述用电地址对应的文本进行文本分词处理,得到相应的各切分词语;
基于各切分词语,构建相应的词向量空间;
统计文本词频,选取词作为特征项,权重用词频表示,通过TF-IDF算法来计算权重值,TF为词频,IDF为一个词在各文本中出现的频率;
将各文本转化成相应的向量形式,并通过分类器对各向量形式的各文本进行分类。
7.根据权利要求6所述的方法,其特征在于,
所述对所述用电地址对应的文本进行文本分词处理,得到相应的各切分词语具体包括:
若所述用电地址对应的文本为收录到词典的词语,则基于词典的词语进行分类,按照正向匹配法进行文本分词处理,得到相应的各切分词语;
若所述用电地址对应的文本为未被词典收录的词语,则基于预设的的统计语言模型进行文本分词处理,得到相应的各切分词语;或者,
所述分类器采用K-近邻算法进行分类,所述K-近邻算法是指给定当前测试文本,系统在训练集中查找离该测试文本最近的K个文本,并根据所述K个文本的类别判断当前测试文本的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于葛得辉;中能瑞通(北京)科技有限公司,未经葛得辉;中能瑞通(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811038149.3/1.html,转载请声明来源钻瓜专利网。





