[发明专利]一种基于电力行业客户服务数据的知识图谱的构建方法有效
申请号: | 202010351966.5 | 申请日: | 2020-04-28 |
公开(公告)号: | CN111581393B | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 宫立华;田诺;刘鲲鹏;盛妍;何学东;徐宏;张明杰;杨菁;何薇;徐倩丽 | 申请(专利权)人: | 国家电网有限公司客户服务中心;北京中电普华信息技术有限公司;北京数洋智慧科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06Q30/02;G06Q50/06 |
代理公司: | 北京鼎真知识产权代理事务所(普通合伙) 11815 | 代理人: | 洪波 |
地址: | 300309 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 电力行业 客户 服务 数据 知识 图谱 构建 方法 | ||
本发明公开了一种基于电力行业客户服务数据的知识图谱的构建方法,包括以下步骤:将两张表记为表A和表B,表A的主键和外键分别记为Ka和Fa,表B的主键和外键分别记为Kb和Fb,以表A为基准,判断Fa字段名称是否等于Fb;当表A的外键名称与表B的主键名称相同,则对Fa与Kb的内容进行一致性检验,如果满足或说明表A与表B存在相关关系;当不满足条件或时。本发明将客户服务数据涉及的上万张表按照数据源表、中间表、结果表进行分类,为表间关系的方向性提供依据,然后通过充分利用每个表的主键、外键、普通字段、以及字段内容,进行字段比较、内容一致性检验等步骤,分析各业务系统的关联关系,从而建立表间关联模型。
技术领域
本发明涉及电力行业技术领域,尤其涉及一种基于电力行业客户服务数据的知识图谱的构建方法。
背景技术
国家电网全网共有4.39亿电力客户,涉及客户的档案信息、电源点、计量点、95598业务、电费等数据分散在公司多个专业,仅营销基础支撑平台就有近200TB数据。目前各专业间信息共享程度不高,形成信息孤岛,从客户视角实现跨数据库间的关联分析较为困难。
现有工具无法实现上万级数据表、十万级数据字段的的高效关联,数据关联分析难度大,缺乏基于数据字段名称及数据内容的相似性识别机制,无法从多版本数据中快速找到需要的信息,分析数据获取困难,分析人员须熟悉源系统数据结构,并通过访问数据库的方式才能进行数据收集,存在过程复杂、效率低下、潜在风险高等问题,用户无法基于业务口径找到对应的数据关联及筛选条件,数据价值挖掘困难。
发明内容
为克服相关技术中存在的问题,本发明实施例提供一种基于电力行业客户服务数据的知识图谱的构建方法,解决了电力行业客户服务数据动辄涉及上万级数据表、十万级数据字段,在数据开发过程中存在的问题。
本发明实施例提供一种基于电力行业客户服务数据的知识图谱的构建方法,包括以下步骤:
将两张表记为表A和表B,表A的主键和外键分别记为Ka和Fa,表B 的主键和外键分别记为Kb和Fb,以表A为基准,判断Fa字段名称是否等于Fb;
当表A的外键名称与表B的主键名称相同,则对Fa与Kb的内容进行一致性检验,如果满足或说明表A与表B存在相关关系;
当不满足条件或时,对普通字段作判断,记Da、Db分别属于表A、B的普通字段集合,记D=Da∩Db;若说明表A与表B不存在相关性;
若记D={D1,D2,...,Di},表示A与B之间的同名字段集合,对表A和表B里面的Di字段进行一致性检验,如果i个字段中,至少有一个满足或判断表A与表B存在相关关系;
若不满足或判断表A与表B不存在相关性;
基于相关性建立表间关联模型,并梳理各表之间的关系;
通过关联模型的结构型数据的知识图谱,构建基于电力行业客户服务数据的知识图谱。
进一步地,所述表包括数据源表、中间表和结果表。
进一步地,记两张表分别为表A和表B,如果表A、B存在某一个字段名称相同,例如ID,且该字段下的内容满足或则认为表A 与表B存在相关关系。
进一步地,所述主键为实体中将一个属性或多个属性的数据设置成具有各不相同的值,以便能惟一地标识实体中的每一条记录;将一个实体的一个属性或多个属性定义为引用其他实体的主键或惟一约束属性,则引用实体中的这个属性或多个属性就称为外键。
进一步地,所述建立关联模型还包括建立数据库。
进一步地,记数据库中表的集合为T={T1,T2,T3,...,Tn},对集合T 中的表进行标记。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司客户服务中心;北京中电普华信息技术有限公司;北京数洋智慧科技有限公司,未经国家电网有限公司客户服务中心;北京中电普华信息技术有限公司;北京数洋智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010351966.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种阿尔茨海默症动物模型的制备方法
- 下一篇:一种多天线分集接收机