[发明专利]基于PtransE模型的知识图谱链接预测方法在审
| 申请号: | 202110237881.9 | 申请日: | 2021-03-04 |
| 公开(公告)号: | CN113051352A | 公开(公告)日: | 2021-06-29 |
| 发明(设计)人: | 陆佳炜;朱昊天;王小定;吴俚达;徐俊;程振波;高飞;肖刚 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/36;G06N3/04;G06N3/08 |
| 代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
| 地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 ptranse 模型 知识 图谱 链接 预测 方法 | ||
一种基于PtransE模型的知识图谱链接预测方法,包括以下步骤:第一步、从知识库中构建目标三元组,并获得该三元组中头实体和尾实体之间所有的路径关系;第二步、进行关系编码,结合Word2vec将目标三元组中的直接关系和所有路径关系表示成向量,并将路径关系表示成的向量输入LSTM进行顺序编码;第三步、进行实体类型编码,获取目标三元组的头实体和尾实体的类型上下文向量;第四步、计算关系路径可靠性,并将上述结果输入能量函数,判断这个三元组是否成立。本发明提升了三元组的表示精度,增加了预测结果的准确度。
技术领域
本方法涉及一种基于PtransE模型的知识图谱链接预测方法。
背景技术
知识库将人类知识组织成结构化的知识系统,它描述现实世界中实体(entity)间的关系(relation)。人们花费大量精力构建了各种结构化的知识库,如语言知识库WordNet、世界知识库Freebase等。知识库是推动人工智能学科发展和支撑智能信息服务应用(如智能搜索、智能问答、个性化推荐等)的重要基础技术。为了改进信息服务质量,国内外互联网公司(特别是搜索引擎公司)纷纷推出知识库产品,如谷歌知识图谱、微软BingSatori、百度知心以及搜狗知立方等。著名的IBM Watson问答系统和苹果Siri语音助理的背后,知识库也扮演着重要角色。知识库的兴起拉开了智能信息检索从字符串匹配跃迁至智能理解的序幕。
知识图谱由Google公司于2012年6月正式提出,是一种基于图的数据结构。知识图谱是一种结构化的语义知识库,以图的形式来展现现实世界中各个实体及其相互之间的关系,并用形式化的方式来进行描述。知识图谱的基本组成单元的通用表示形式是实体、“实体-关系-实体”三元组,以及实体的“属性-值”对。知识图谱以“实体-关系-实体”或“实体-属性-属性值”的三元组表达形式存储,这些数据将构成可观的实体关系网络,即知识的“图谱”。
表示学习的目标是,通过机器学习将研究对象的语义信息表示为稠密低维实值向量。知识表示学习是面向知识库中实体和关系的表示学习,通过将实体或关系投影到低维向量空间,能够实现对实体和关系的语义信息的表示,可以高效地计算实体、关系及其之间的复杂语义关联。知识库的表示学习旨在将实体和关系嵌入到一个低维空间中。大多数现有的方法在表示学习中只考虑直接关系,而PtransE提出了一种基于路径的表示学习模型,它将关系路径作为表示学习实体之间的转换。但是它仅仅依赖于关系,并且直接使用特定实体信息,在推演多步关系时仍然存在一定局限性。
长短期记忆网络(Long Short-Term Memory,LSTM),最早由Hochreiter、Schmidhuber于1997年提出,该模型由于能更好地发现长期依赖关系而被广泛用于处理时间序列信息。LSTM可以看作为特殊的RNN,其主要为解决长序列训练过程中的梯度消失及梯度爆炸问题,能够在更长的时间序列上依然表现优异。
发明内容
为了克服现有技术的不足,本发明提出了基于PtransE模型的知识图谱链接预测方法,对知识库中三元组的关系和实体分别进行关系编码和实体类型编码,获得相应的向量输出,将向量经过LSTM处理后的结果输入能量函数,来判定这个三元组是否成立,从而预测知识图谱中实体间的链接关系;提升了三元组的表示精度,增加了预测结果的准确度。
本发明提供如下的技术方案:
一种基于PtransE模型的知识图谱链接预测方法,所述方法包括以下步骤:
第一步、从知识库中构建目标三元组,并获得该三元组中头实体和尾实体之间所有的路径关系;
第二步、进行关系编码,结合Word2vec将目标三元组中的直接关系和所有路径关系表示成向量,并将路径关系表示成的向量输入LSTM进行顺序编码;
第三步、进行实体类型编码,获取目标三元组的头实体和尾实体的类型上下文向量;
第四步、计算关系路径可靠性,并将上述结果输入能量函数,判断这个三元组是否成立。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110237881.9/2.html,转载请声明来源钻瓜专利网。





