[发明专利]统一数据模型构建方法、系统、终端设备及可读存储介质在审
申请号: | 202110622096.5 | 申请日: | 2021-06-03 |
公开(公告)号: | CN113360668A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 徐会芳;谈元鹏;焦飞;张中浩;仝杰 | 申请(专利权)人: | 中国电力科学研究院有限公司;国家电网有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06Q50/06 |
代理公司: | 北京中巡通大知识产权代理有限公司 11703 | 代理人: | 孟大帅 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 统一 数据模型 构建 方法 系统 终端设备 可读 存储 介质 | ||
本发明属于模型构建技术领域,具体公开了一种统一数据模型构建方法、系统、终端设备及可读存储介质;所述统一数据模型构建方法包括以下步骤:基于预设多个电力垂直业务知识图谱的本体框架,获得各图谱的本体概念;采用基于混合策略的相似度计算方法对所述各图谱的本体概念进行归并,完成统一数据模型构建。本发明提出了基于多个垂直知识图谱建立统一的数据模型的方法,可以按照统一规范维护和管理数据,能够提升上层应用的交互效率和便利性。
技术领域
本发明属于数据模型构建技术领域,涉及基于电力垂直业务知识图谱构建数据模型领域,特别涉及一种统一数据模型构建方法、系统、终端设备及可读存储介质。
背景技术
随着知识图谱技术的兴起,专家学者近年来在电力调度、电力运检、电力营销等诸多领域提出了基于领域知识图谱这一新兴认知方法的技术路线和应用案例,相应地构建了电力调度、运检、营销知识图谱。
本体作为知识图谱的核心部分,在解决领域知识共享的同时也引入了新问题;其中,一方面,本体创建具有主观性,即不同用户根据自己对领域知识的主观理解来构建和维护本体;另一方面,本体的创建和使用还具有分布性,即同领域内的相关本体可能由不同的用户来创建和维护,这种创建不一定是协同完成的。因此,即便在同一领域,也存在着不同本体,而且不同本体所描述的内容通常在语义上存在重叠或关联关系,其使用的本体表示语言和表示模型存在有差异,这种现象称为本体异构。
目前,各个电力垂直业务知识图谱存在数据多源、本体异构等技术问题,图谱之间尚未建立图谱中知识的管理关系,其下游应用(如智能索搜索、智能问答、个性化推荐等基于图谱的应用)需通过访问不同的图谱获取目标信息。现有这种分散和异构的数据模型不利于数据共享和通信,给上层业务应用进行语义交换增加了成本。
综上,异构的知识图谱系统不利于业务流程的优化和特性设计,目前各个系统之间的信息共享基本采用点对点或者临时信道的方式进行信息互通和共享,这种数据交互缺乏统一的规范,实现代价高而且不利于维护和发展。
发明内容
本发明的目的在于提供一种统一数据模型构建方法、系统、终端设备及可读存储介质,以解决上述存在的一个或多个技术问题。本发明提出了基于多个垂直知识图谱建立统一的数据模型的方法,可以按照统一规范维护和管理数据,能够提升上层应用的交互效率和便利性。
为达到上述目的,本发明采用以下技术方案:
本发明的一种统一数据模型构建方法,包括以下步骤:
基于预设多个电力垂直业务知识图谱的本体框架,获得各图谱的本体概念;
采用基于混合策略的相似度计算方法对所述各图谱的本体概念进行归并,完成统一数据模型构建。
本发明的进一步改进在于,所述采用基于混合策略的相似度计算方法对所述各图谱的本体概念进行归并的步骤具体包括:
通过计算基于名称的概念相似度、基于实例的概念相似度、基于属性的概念相似度和基于结构的概念相似度中的一种或多种相似度,得到各图谱的本体概念之间不同维度的匹配度;
基于所述匹配度加权计算获得各图谱的本体概念之间最终的匹配置信度;
将匹配置信度大于预设阈值的本体概念进行归并,将归并后的概念添加到统一数据模型;将匹配置信度小于等于预设阈值的本体概念保留原始信息,添加到统一数据模型。
本发明的进一步改进在于,计算基于名称的概念相似度的步骤具体包括:
基于字符串的相似度计算:将本体概念的名称作为字符串,进行规范化操作后,使用表达式(1)进行相似度计算:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电力科学研究院有限公司;国家电网有限公司,未经中国电力科学研究院有限公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110622096.5/2.html,转载请声明来源钻瓜专利网。