[发明专利]基于图表示学习和深度强化学习的知识推理方法及装置在审
申请号: | 202110928277.0 | 申请日: | 2021-08-13 |
公开(公告)号: | CN113780002A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 赵刚;宋浩楠;王兴芬 | 申请(专利权)人: | 北京信息科技大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/35;G06F16/36;G06N3/04;G06N3/08 |
代理公司: | 北京天方智力知识产权代理事务所(普通合伙) 11719 | 代理人: | 路远 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图表 学习 深度 强化 知识 推理 方法 装置 | ||
1.一种基于图表示学习和深度强化学习的知识推理方法,其特征在于,包括以下步骤:
构建关系图神经网络模型,将知识图谱数据输入到所述模型,根据输入数据的不同关系类别提取知识的图拓扑结构信息和语义信息;
以提取的信息为基础,构建强化学习模型,通过强化学习智能体和环境的交互进行知识推理,输出推理结果。
2.根据权利要求1所述的基于图表示学习和深度强化学习的知识推理方法,其特征在于,所述关系图神经网络模型通过关系和节点即实体进行双重聚合提取知识的图拓扑结构信息和语义信息,具体包括:
将知识图谱数据按照不同的关系类别进行分类;
针对每一类别的不同知识集合进行信息聚合,得到每一类别的节点表示;
将每一类别的当前节点和其邻居的节点划分为入关系集合和出关系集合,并分别对这两种关系集合进行转换操作,入关系集合是邻居节点指向当前节点的边的集合,出关系集合是当前节点指向邻居节点的边的集合;
将所有类别得到的信息进行聚合,并由激活函数进行非线性化,获得知识图谱中实体的表示信息。
3.根据权利要求2所述的基于图表示学习和深度强化学习的知识推理方法,其特征在于,所述关系图神经网络进行双重聚合的操作表示为:
式中,表示当前节点Vi的第l层隐藏状态,表示Vi的邻居节点Vj的第l层隐藏状态,σ是一种非线性激活函数,表示与Vi相邻并且关系为r的邻居节点集合,表示集合中元素的数量即关系为r的邻居节点的数量,表示关系为r的邻居节点的第l层隐藏状态的转移权值,R为Vi与邻居节点的关系集合,表示Vi的第l层隐藏状态的转移权值,表示自环即自己指向自己的权重。
4.根据权利要求3所述的基于图表示学习和深度强化学习的知识推理方法,其特征在于,σ为ReLU函数,表达式为:
5.根据权利要求1所述的基于图表示学习和深度强化学习的知识推理方法,其特征在于,所述强化学习模型包括环境、状态、动作和奖励,其中,
环境由知识图谱图表示空间组成;
状态由知识表示、LSTM、图注意力机制三部分拼接而成;状态的知识表示部分为mt=et,et为当前实体经过图表示学习后的嵌入向量;状态的LSTM部分是由强化学习智能体在知识图谱环境中推理过程中的记忆单元,记为ht=LSTM(ht-1,mt),其中,h0=0;状态的图注意力机制部分为Ni为实体ei的周围实体的数量,aik为实体ei和其周围实体ek之间的注意力权重其中表示权重向量,W表示线性转移矩阵;
动作是交互过程中智能体单步移动选择的边At={(r',e')|(et,r',e')∈G},其中et表示当前时刻t智能体所在位置的实体,r'、e'分别为与实体et相连接的关系和实体,G表示知识图谱中所有由头实体、关系和尾实体组成的三元组数据;
奖励包括推理过程获得的奖励和软奖励,表示为:
R(sT)=Rglobal(sT)+(1-Rglobal(sT))f(es,rq,eT)
Rglobal(sT)=Rg+Rd+Rp
其中,R(sT)为智能体最终状态sT的奖励,Rglobal(sT)为推理过程获得的奖励,Rg、Rd和Rp分别为全局奖励、路径多样性奖励和路径有效性奖励,f(es,rq,eT)为软奖励,es、rq和eT分别为头实体、关系和尾实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110928277.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种出货方法和配送系统
- 下一篇:一种家用地下室入户门防进水闸门