[发明专利]一种基于多智能体强化学习的知识图谱多跳推理方法在审
| 申请号: | 202211566685.7 | 申请日: | 2022-12-07 |
| 公开(公告)号: | CN115860122A | 公开(公告)日: | 2023-03-28 |
| 发明(设计)人: | 黄刚;王丹;李波;俞再亮 | 申请(专利权)人: | 之江实验室;西安电子科技大学 |
| 主分类号: | G06N5/04 | 分类号: | G06N5/04;G06N5/043;G06N5/022;G06F16/36;G06F16/35;G06N3/045;G06N3/0442;G06N3/042;G06N3/047;G06N3/048;G06N3/092 |
| 代理公司: | 郑州知倍通知识产权代理事务所(普通合伙) 41191 | 代理人: | 邱珍珍 |
| 地址: | 311121 *** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 智能 强化 学习 知识 图谱 推理 方法 | ||
1.一种基于多智能体强化学习的知识图谱多跳推理方法,其特征在于:含有以下步骤,
步骤一、将知识图谱作为智能体感知的环境,并对知识图谱进行预处理;
步骤二、设计强化学习算法中用于训练智能体的网络结构;
步骤三、初始化所有智能体的状态信息和算法参数;
步骤四、将预处理的知识图谱作为智能体的环境,利用强化学习算法使智能体与环境交互进行迭代学习,得到训练完成的策略网络;
步骤五、使用训练完成的策略网络对待处理的知识图谱进行推理预测。
2.根据权利要求1所述的基于多智能体强化学习的知识图谱多跳推理方法,其特征在于:所述步骤一包含以下分步骤:
步骤1.1、将给定的知识图谱作为智能体感知的环境,并将知识图谱表示为有向图其中ε是实体集合,/是关系集合;知识图谱中的每个有向连接表示一个元组集合/其中esource是源实体,r是查询关系,etarget是目标实体;将知识图谱所有元组集合中关系的逆关系所对应的元组集合添加到知识图谱中,即元组集合/中关系r的逆关系r-1对应的元组集合为
步骤1.2、使用embedding模型初始化知识图谱的实体集合和关系集合,将知识图谱的实体和关系表示成维度为embedding_size的向量;
步骤1.3、使用K-Means算法对知识图谱的实体embedding向量进行聚类处理,将知识图谱划分为个节点集群;然后基于划分后的节点集群构建簇连通图/将每个节点集群作为簇节点,若两个簇节点间存在实体连接关系,则将两个簇节点按照实体间关系指向进行有向连接。
3.根据权利要求1所述的基于多智能体强化学习的知识图谱多跳推理方法,其特征在于:所述步骤二包含以下分步骤:
步骤2.1、使用一个长短期记忆网络编码高层智能体和两个低层智能体的历史搜索路径,如关系智能体和实体智能体,其中高层智能体的历史搜索路径为低层智能体的历史搜索路径为/在长短期记忆网络中,将编码后的高层智能体和低层智能体的历史路径信息/级联,得到联合历史路径信息表示并结合各智能体选择的动作向量计算得到各智能体的隐藏状态向量;高层智能体和低层智能体彼此共享历史搜索路径信息,增强各自的状态表示;
步骤2.2、使用单层前馈神经网络和SoftMax函数作为注意力机制,计算低层智能体的当前位置实体与邻接实体的注意力向量;
步骤2.3、高层智能体、关系智能体和实体智能体的策略网络为三个独立的具有ReLU非线性激活函数的两层前馈神经网络和/使用智能体的策略网络计算智能体动作空间中所有动作的概率分布,进而根据动作概率分布选取智能体的下一个动作。
4.根据权利要求1所述的基于多智能体强化学习的知识图谱多跳推理方法,其特征在于:所述步骤三包含以下分步骤:
步骤3.1、初始化智能体的状态信息,包括初始化源实体节点esource和源簇节点csource、查询关系rq、目标实体节点etarget和目标簇节点ctarget,高层智能体从源簇节点csource出发,使用策略网络在邻接簇节点中选择簇作为下一个动作,直到到达目标簇节点ctarget或者跳转至设定的最大步长时停止搜索,对于低层智能体,关系智能体和实体智能体从源实体节点esource出发,交替使用关系智能体的策略网络/和实体智能体的策略网络/选择关系和实体,直到到达目标实体节点etarget或者跳转至设定的最大步长时停止搜索;
步骤3.2、初始化算法参数,包括强化学习算法训练总轮数P、智能体迭代搜索的最大步长T、强化学习算法训练的学习率learning_rate、熵正则化常数β、移动平均常数η、实体和关系的嵌入向量大小embedding_size、长短期记忆网络隐藏层大小hidden_size、训练样本的批次大小batch_size、测试阶段波束搜索的大小beam_size。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室;西安电子科技大学,未经之江实验室;西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211566685.7/1.html,转载请声明来源钻瓜专利网。





