[发明专利]一种基于地址匹配技术的电网数据关联方法在审
申请号: | 201810250327.2 | 申请日: | 2018-03-26 |
公开(公告)号: | CN108416062A | 公开(公告)日: | 2018-08-17 |
发明(设计)人: | 王宗伟;陈鹏;盛妍;金鹏;李艳艳;卜晓阳;赵郭燚;张全;刘鲲鹏;宫立华;杨菁 | 申请(专利权)人: | 国家电网公司客户服务中心 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/06 |
代理公司: | 天津佳盟知识产权代理有限公司 12002 | 代理人: | 李益书 |
地址: | 300000 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关联 电网数据 地址匹配技术 地址字符串 地址信息 预处理 编辑距离计算 编辑距离算法 非结构化数据 阿拉伯数字 结构化数据 档案信息 地址匹配 客户基础 模糊匹配 文本信息 误判概率 用户报修 中文分词 专业数据 结构化 中文 客户 删除 保存 融合 投诉 分析 | ||
本发明涉及一种基于地址匹配技术的电网数据关联方法。目的是使没有客户编号的报修及投诉工单通过地址模糊匹配技术与客户基础档案信息进行关联。电网数据关联方法,包括如下步骤:预处理;接收客户的保修地址信息,并保存为文本信息;删除结构化地址信息、特殊字符、阿拉伯数字;中文地址字符串进行编辑距离计算;将计算结果最小者所对应的用户中文地址字符串确定为用户报修地址。本发明相对于现有技术的进步在于:本方法提出利用非结构化数据关联实现结构化数据关联的方式,实现了跨专业数据融合分析;基于最小编辑距离算法计算地址匹配度,避免采用中文分词降低误判概率。
技术领域:
本发明涉及专门适用于电力公共服务部门的方法,具体涉及一种基于地址匹配技术的电网数据关联方法。
背景技术:
经过5年的集中运营,国网客服中心目前已经积累了156TB的客户诉求数据和录音信息,但是受各地方言难以精确识别、90%以上的客户无法提供用电编号等问题影响,加之公司营配调数据未完全实现贯通,无法通过“站-线-变-户”关联数据结构精准建立客户报修位置与电网设备之间的关系,从客户视角分析电网设备供电质量问题。
客户报修数据中包含客户用电地址信息,在无法通过客户编号实现关联的背景下,需要通过客户报修地址模糊关联客户基础档案信息中的地址,进而能够通过“户-变”关系,准确定位客户报修的电网设备。但是地址数据为非结构化数据,同一地址不同的表述方式可能导致数据间无法进行关联,加之95598客服专员主要通过接听客户电话记录客户报修地址,方言和同音字也可能导致记录信息存在偏差,给准确匹配地址信息带来较大难度。
目前分析停电”站-线-变-户”的关联关系主要通过两种手段,一是基于停电信息到户的关联分析。该方法通过调度部门发布的停电信息,结合电网拓扑结构和客户用电基础档案信息,自顶向下进行关联,依托停电信息数据、停电设备数据及停电客户清单三类数据间的关联关系实现关联分析。二是通过客户编号进行关联分析。建立客户通过95598热线报修的数据与电网拓扑结构的数据关联,利用“客户-计量表-设备表-线路表-变电站表表”的关联关系使工单与电网设备关联。该方法需要客户提供客户编号,但实际中超过90%的客户无法提供用电编号,因此该方法无法获取足够的样本量数据。
综上所述,现有基于停电信息到户的关联分析和通过客户编号进行关联分析是目前开展停电”站-线-变-户”关联分析的主流手段,但两种方法均存在一定的问题。
基于停电信息到户的关联分析的主要缺点为受电网遥测数据质量影响,30分钟内发布的电网故障停电信息范围可能不完全准确,存在漏报和错报的情况,加之“客户-变压器”对应关系普遍存在误差,供电企业发布的停电到户清单与真实停电客户存在一定差异,对分析准确性带来影响。
通过客户编号进行关联分析的主要缺点为客户通过95598热线报修故障时,很难在第一时间内提供客户编号,通过实际统计发现超过90%的报修客户无法提供用电编号。另外,受方言和热线通话质量等因素影响,95598客服专员可能存在户号记录存在错误的问题,因此该方法在数据覆盖程度和准确性方面均存在一定影响。
发明内容:
本方法主要基于计算地址文本相似度的方法辅助挖掘95598工单客户地址和客户用电地址数据中存在的匹配关联关系,建立分析关联关系桥梁,使没有客户编号的报修及投诉工单通过地址模糊匹配技术与客户基础档案信息进行关联,进而能够关联分析到电网设备,实现通过客户拨打95598直接关联分析电网设备,支撑国家电网公司生产运行和电网建设工作。
目前,95598客户报修记录的现场地址信息分为两个部分,一部分为结构化数据,包含省、市及县级供电单位信息;另一部分为非结构化数据,涵盖村、镇、街道、路、小区及门牌号组合的字符串信息,例如:在“湖北省荆州市江陵县郝穴镇江城社区江陵大道木材站宿舍”这一地址信息中,“湖北省荆州市江陵县”就属于结构化地址信息,“郝穴镇江城社区江陵大道木材站宿舍”就属于非结构化地址信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网公司客户服务中心,未经国家电网公司客户服务中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810250327.2/2.html,转载请声明来源钻瓜专利网。