[发明专利]一种基于置信超平面和词典信息的知识图谱表示学习方法有效
申请号: | 201910898621.9 | 申请日: | 2019-09-23 |
公开(公告)号: | CN110647620B | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 郑丽敏;高霖汉 | 申请(专利权)人: | 中国农业大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于置信超平面和词典信息的知识图谱表示学习方法。本发明的方法为:利用文章词典信息得到实体所属类别以及所属类别的概率;通过实体所属类别及所属类别的概率得到知识表示关系的置信矩阵,并重构三元组;根据置信矩阵,改进超平面模型的能量函数;根据带置信矩阵和词典信息的超平面模型处理一对多的知识表示关系。在该方法中基于改进的超平面模型,实体在对于不同关系具有不同程度的相关性。本发明能够提升知识表示学习在复杂关系下的区分能力,并且避免了增加过多模型复杂度。本发明方法可以对知识图谱中的实体和关系进行表示,用于知识图谱的补全和推理,尤其可以提升概率型知识图谱的准确度,具有较好的实用性。 | ||
搜索关键词: | 一种 基于 置信 平面 词典 信息 知识 图谱 表示 学习方法 | ||
【主权项】:
1.一种基于置信超平面和词典信息的知识图谱表示学习方法,其特征在于,包括:/n步骤1 通过分词工具对领域文章进行分词;人工对若干文章进行标注,得到这批文章中真实的实体及实体所属类别;从训练集全部文章中提取实体和实体所属类别的共现关系;以一篇文章中共现次数最大的类别作为实体在该文章中所属的类别;根据训练集中全部文章获得实体所有的所属类别和实体属于各个类别中的概率;经过神经网络算法训练后,得到最优的实体、实体所属的所有类别和实体所属类别的概率;/n步骤2,输入知识图谱中的三元组(h*,r*,t*),将步骤1中获得的实体类别标签加入头实体向量和尾实体向量中,并将实体属于该类的概率作为置信矩阵p;并将关系向量空缺部分用“1”补齐,形成新的三元组(h,r,t);/n步骤3,根据置信矩阵,定义三元组(h,r,t)中实体向量、关系向量和置信矩阵之间的相互关联;/n步骤4,通过损失函数将实体向量、关系向量和置信矩阵关联起来,并最小化损失函数,以学习实体向量、关系向量和置信矩阵,达到优化目标。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业大学,未经中国农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910898621.9/,转载请声明来源钻瓜专利网。