[发明专利]一种基于多向语义的知识图谱复杂关系推理方法有效
| 申请号: | 202110329759.4 | 申请日: | 2021-03-29 |
| 公开(公告)号: | CN112711667B | 公开(公告)日: | 2021-07-06 |
| 发明(设计)人: | 姜华;杨世辉;田济东;郦一天;胡博文 | 申请(专利权)人: | 上海旻浦科技有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/30 |
| 代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 张宁展 |
| 地址: | 200120 上海市浦东新区中国*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 多向 语义 知识 图谱 复杂 关系 推理 方法 | ||
本发明提供了一种基于多向语义的知识图谱复杂关系推理方法,将知识图谱的训练样本数据集中的实体映射为两组低维空间向量表示;将知识图谱的训练样本数据集中的关系映射为两组低维空间向量和一维参数表示;随机选择知识图谱的训练样本数据集中的实体,替换训练样本正三元组的实体,生成训练负样本数据;根据训练样本正三元组和生成的训练负样本,定义训练过程中的目标函数;将训练样本数据集中的实体映射结果和关系映射结果分别带入目标函数,优化得到知识图谱中每个实体或关系对应的向量表示;利用优化得到的向量表示,计算知识图谱三元组中实体和关系之间的距离值,并根据距离值进行关系推理。本发明提高了对复杂关系的推理效果。
技术领域
本发明涉及人工智能中知识图谱技术领域,具体地,涉及一种利用人工智能表示学习方法对知识图谱中复杂关系进行推理的方法。
背景技术
随着人工智能技术的发展,知识图谱越来越得到学术界和工业界的关注,知识图谱在未来人工智能发展中起着举足轻重的作用。知识图谱是以头实体、尾实体及其之间存在的关系组成的三元组为基本单元,其中实体可以是现实世界中的实体,比如具体人名、地名、机构等,也可以代表属性的属性值或概念,比如某颜色等,关系可以是两个实体和实体之间的现实关系,比如夫妻关系、从属关系,也可以是实体和属性值之间的关系,比如年龄等。但随着互联网发展,每时每刻都在产生大量的数据,其中就产生大量的三元组知识,以至于每个实体会与其他实体之间存在复杂的关系。随着构建知识图谱规模的不断扩大,知识图谱内复杂的关系无法采取人工的方式进行补全。所以针对知识图谱关系推理补全问题出现了的大量相关研究。其中出现了一些将实体和关系映射为低维向量,再利用向量关系进行推理的研究,常称为表示学习方法,比如TransE、TransH和TransR等关系推理方法。虽然这些模型在某些方面表现出其优势和创新,但是这些模型在利用语义信息进行复杂关系推理时,只考虑关系推实体的语义影响,没有考虑实体对实体的语义影响以及实体对关系的语义影响。比如(人类,吃,蔬菜)学习语义表示向量时,“人类”的语义信息应该受到“蔬菜”和“吃”的语义影响,同理“蔬菜”的语义信息同样应该受到“人类”和“吃”的影响,这样致使学习到的语义向量表示实体或关系语义信息不充分,最终影响对复杂关系的推理效果。
发明内容
本发明针对现有技术中存在的上述不足,提供了一种基于多向语义的知识图谱复杂关系推理方法。
本发明是通过以下技术方案实现的。
一种基于多向语义的知识图谱复杂关系推理方法,包括:
将知识图谱的训练样本数据集中的实体映射为两组低维空间向量表示;
将知识图谱的训练样本数据集中的关系映射为两组低维空间向量和一维参数表示;
随机选择知识图谱的训练样本数据集中的实体,替换训练样本正三元组的实体,生成训练负样本数据;
根据训练样本正三元组和生成的训练负样本,定义训练过程中的目标函数为:
式中,,其中表示正三元组的距离函数,表示正三元组的对应负样本的距离函数;其中:
或
或
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海旻浦科技有限公司,未经上海旻浦科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110329759.4/2.html,转载请声明来源钻瓜专利网。





