[发明专利]知识图谱的处理方法、装置、设备和介质有效
申请号: | 201910537133.5 | 申请日: | 2019-06-20 |
公开(公告)号: | CN110263083B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 林义明;郭辉;徐伟建;纪登林;罗雨;彭卫华;史亚冰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/26 | 分类号: | G06F16/26;G06F16/36;G16H50/70 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 处理 方法 装置 设备 介质 | ||
1.一种知识图谱的处理方法,其特征在于,所述方法包括:
根据待验证知识图谱,从待验证知识图谱所属目标领域的实体证据单元中选择至少两个候选实体证据单元;其中,所述实体证据单元是通过在所述目标领域的知识事实进行挖掘得到的;
确定所述待检验知识图谱与所述至少两个候选实体证据单元的匹配度;
根据所述匹配度,从所述至少两个候选实体证据单元中选择所述待检验知识图谱的目标实体证据单元,供基于所述目标实体证据单元对所述待验证知识图谱进行验证。
2.根据权利要求1所述的方法,其特征在于,根据待验证知识图谱,从待验证知识图谱所属目标领域的实体证据单元中选择至少两个候选实体证据单元之前,还包括:
从目标领域事实中提取属性信息和属性信息所属的章节标题信息;
将所述章节标题信息作为目标领域中实体证据单元的标题;
将所述属性信息中的属性名称作为目标领域中实体证据单元的属性关键字;
将所述属性信息中的属性内容作为目标领域中实体证据单元的属性键值。
3.根据权利要求1所述的方法,其特征在于,根据待验证知识图谱,从待验证知识图谱所属目标领域的实体证据单元中选择至少两个候选实体证据单元,包括:
将待验证知识图谱中的实体名作为搜索词,在目标领域的实体证据单元的章节标题信息、属性关键字和属性键值中进行搜索,得到第一实体证据单元;
将待验证知识图谱中的属性值作为搜索词,在目标领域的实体证据单元的属性键值中进行搜索,得到第二实体证据单元;
从所述第一实体证据单元和所述第二实体证据单元中选择至少两个候选实体证据单元。
4.根据权利要求3所述的方法,其特征在于,从所述第一实体证据单元和所述第二实体证据单元中选择至少两个候选实体证据单元之后,还包括:
根据知识图谱中属性名与实体证据单元中属性关键字之间的映射关系,以及待验证知识图谱,从所述至少两个候选实体证据单元中选择与所述待验证知识图谱匹配的候选实体证据单元,且滤除其他候选实体证据单元。
5.根据权利要求1所述的方法,其特征在于,确定所述待检验知识图谱与所述至少两个候选实体证据单元的匹配度,包括:
确定待检验知识图谱中的实体名,与候选实体证据单元中的标题之间的标题相似度;
确定待检验知识图谱中的属性值,与候选实体证据单元中的属性键值之间的键值相似度;
根据所述候选实体证据单元的标题相似度和键值相似度,确定候选实体证据单元的匹配度。
6.根据权利要求5所述的方法,其特征在于,确定待检验知识图谱中的实体名,与候选实体证据单元中的标题之间的标题相似度,包括:
将所述待检验知识图谱中的实体名与候选实体证据单元中的标题,作为预测模型的输入,得到第一标题相似度;
根据所述待检验知识图谱的实体名与候选实体证据单元的标题之间的文本重合关系,确定第二标题相似度。
7.根据权利要求6所述的方法,其特征在于,确定待检验知识图谱中的属性值,与候选实体证据单元中的属性键值之间的键值相似度,包括:
将所述待检验知识图谱中的属性值与候选实体证据单元中的属性键值,作为预测模型的输入,得到第一键值相似度;
根据所述待检验知识图谱的属性值与候选实体证据单元的属性键值之间的文本重合关系,确定第二键值相似度。
8.根据权利要求7所述的方法,其特征在于,根据所述候选实体证据单元的标题相似度和键值相似度,确定候选实体证据单元的匹配度之前,还包括:
若任一候选实体证据单元的标题相似度小于第一标题相似度阈值,或者该候选实体证据单元的键值相似度小于第一键值相似度阈值,则滤除该候选实体证据单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910537133.5/1.html,转载请声明来源钻瓜专利网。