[发明专利]获得知识图谱中的数据模型的方法、装置、设备和介质有效
申请号: | 201910081843.1 | 申请日: | 2019-01-28 |
公开(公告)号: | CN109815343B | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 李千;史亚冰;梁海金;张扬;朱勇 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 李辉 |
地址: | 100094 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 获得 知识 图谱 中的 数据模型 方法 装置 设备 介质 | ||
1.一种用于获得知识图谱中的数据模型的方法,包括:
接收描述实体与对象之间的关系的知识条目;
基于所述实体、所述关系和所述对象中的至少一项,来确定所述对象的多个候选类型;
基于预定规则,从所述多个候选类型中确定用于生成与所述知识条目相匹配的数据模型的对象类型;以及
至少基于所述对象类型来生成所述数据模型,
其中确定所述对象的所述多个候选类型包括:
确定所述实体的多个实体上位词;
确定所述对象的多个对象上位词;
从所述多个实体上位词和所述多个对象上位词中确定与所述知识条目的语义匹配度最高的实体上位词和对象上位词的组合;以及
基于所述组合中的所述对象上位词,来确定所述多个候选类型之一。
2.根据权利要求1所述的方法,其中确定所述对象的所述多个候选类型包括:
将所述知识条目中描述所述关系的词语划分成多个分词;以及
基于所述多个分词之一来确定所述对象的第一候选类型。
3.根据权利要求1所述的方法,其中确定所述对象的所述多个候选类型包括:
确定所述知识条目中描述所述对象的词语的词性;
基于所述词性来确定所述对象是否与预定的非事物类型匹配;以及
响应于确定所述对象与所述预定的非事物类型匹配,将所述预定的非事物类型确定为所述对象的第二候选类型。
4.根据权利要求3所述的方法,其中所述预定的非事物类型为以下之一:文本类型、时间类型、数字类型、数量类型和枚举类型。
5.根据权利要求1所述的方法,其中确定所述对象的所述多个候选类型包括:
通过预测与所述实体具有所述关系的对象类型,来确定所述对象的第三候选类型。
6.根据权利要求1所述的方法,其中确定所述对象的所述多个候选类型包括:
基于所述知识条目的语义来确定所述对象是否与预定对象类型集合中的对象类型匹配;以及
响应于确定所述对象与所述预定对象类型集合中的对象类型匹配,将所匹配的对象类型确定为所述对象的第五候选类型。
7.根据权利要求1所述的方法,其中从所述多个候选类型中确定用于生成所述数据模型的所述对象类型包括:
基于所述预定规则,选择所述多个候选类型之一作为用于生成所述数据模型的所述对象类型。
8.根据权利要求1所述的方法,其中所述多个候选类型至少包括第六候选类型和第七候选类型,并且从所述多个候选类型中确定用于生成所述数据模型的所述对象类型包括:
确定所述第六候选类型和所述第七候选类型的共同上位词;以及
基于所述共同上位词来确定用于生成所述数据模型的所述对象类型。
9.根据权利要求1所述的方法,还包括:
接收描述多个实体与多个对象之间的相应关系的多个知识条目;
生成与所述多个知识条目相匹配的多个数据模型,所述多个数据模型至少包括第一数据模型和第二数据模型,所述第一数据模型指示与第一实体类型具有第一关系的第一对象类型,并且所述第二数据模型指示与所述第一实体类型具有所述第一关系的第二对象类型;
响应于所述第一对象类型不同于所述第二对象类型,从所述多个对象中确定与所述第一对象类型相匹配的对象的第一数目和与所述第二对象类型相匹配的对象的第二数目;以及
基于所述第一数目和所述第二数目,保留所述第一数据模型和所述第二数据模型中的至少一个数据模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910081843.1/1.html,转载请声明来源钻瓜专利网。