[发明专利]数据处理方法、装置及电子设备在审
申请号: | 202111123879.5 | 申请日: | 2021-09-24 |
公开(公告)号: | CN113868433A | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 邹丹;黎丹 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 鲁梅 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 电子设备 | ||
本申请公开了一种数据处理方法、装置及电子设备,方法包括:获得至少一个图谱检查项,所述图谱检查项与知识图谱文件中的实体相关,所述知识图谱文件通过至少对原始数据进行图谱转换得到;使用所述图谱检查项,对所述知识图谱文件进行检测,以得到所述知识图谱文件的检测结果,所述检测结果表征所述知识图谱文件相对于所述原始数据的准确度。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种数据处理方法、装置及电子设备。
背景技术
知识图谱可以广泛应用于智能搜索、智能问答和个性化推荐等领域,基于原始数据所构建的知识图谱的质量也变得越来越重要。
衡量知识图谱质量的关键点之一,就是如何衡量所构建的知识图谱与原始数据之间的差异,也就是衡量知识图谱相对于原始数据的准确性。
发明内容
有鉴于此,本申请提供一种数据处理方法、装置及电子设备,如下:
一种数据处理方法,包括:
获得至少一个图谱检查项,所述图谱检查项与知识图谱文件中的实体相关,所述知识图谱文件通过至少对原始数据进行图谱转换得到;
使用所述图谱检查项,对所述知识图谱文件进行检测,以得到所述知识图谱文件的检测结果,所述检测结果表征所述知识图谱文件相对于所述原始数据的准确度。
上述方法,可选的,获得至少一个图谱检查项,包括:
获得与所述知识图谱文件中的实体相关的实体约束条件;
对所述实体约束条件中的目标实体和约束参数进行解析,以得到至少一个图谱检查项,所述图谱检查项中至少包含所述目标实体和所述目标实体对应的约束参数。
上述方法,可选的,所述实体约束条件包含:实体类型的约束条件、实体属性的约束条件、实体关系的约束条件、实体域的约束条件和实体值的约束条件中的任意一项或任意多项。
上述方法,可选的,获得与所述知识图谱文件中的实体相关的实体约束条件,包括以下任意一项或任意多项:
解析所述知识图谱文件对应的本体文件,以得到所述本体文件对应的第一约束条件;所述本体文件用于对所述原始数据进行图谱转换,以得到所述知识图谱文件;
针对所述原始数据所对应的数据领域,获得预设的第二约束条件;
根据输入操作,获得第三约束条件,所述输入操作为对所述知识图谱文件中的实体进行约束的操作。
上述方法,可选的,使用所述图谱检查项,对所述知识图谱文件进行检测,以得到所述知识图谱文件的检测结果,包括:
在所述知识图谱文件中,获得所述图谱检查项对应的三元组实例或概念;
根据所述图谱检查项中的约束参数,对所述三元组实例或概念进行检测,以得到所述图谱检查项对应的检查项检测结果;
根据所述检查项检测结果,获得所述知识图谱文件的检测结果。
上述方法,可选的,根据所述图谱检查项中的约束参数,对所述三元组实例或概念进行检测,以得到所述图谱检查项对应的检查项检测结果,包括:
将所述图谱检查项中的约束参数与所述三元组实例或概念中的实例内容或概念内容进行比对,以得到所述三元组实例或概念的检测结果;所述实例或概念的检测结果表征所述三元组实例或概念是否准确;
根据所述三元组实例或概念的检测结果,获得所述图谱检查项对应的检查项检测结果;
其中,在所述检测结果表征所述三元组实例或概念准确的三元组实例或概念的个数大于或等于阈值的情况下,所述检查项检测结果表征所述知识图谱文件在所述图谱检查项上准确。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111123879.5/2.html,转载请声明来源钻瓜专利网。