[发明专利]基于对抗式注意力机制的一样本知识图谱关系学习方法及系统有效
申请号: | 201911105384.2 | 申请日: | 2019-11-13 |
公开(公告)号: | CN111046187B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 张春云;崔超然;林培光;吕鹏 | 申请(专利权)人: | 山东财经大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06N3/0475;G06N3/09;G06N3/094 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 董雪 |
地址: | 250014 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 对抗 注意力 机制 样本 知识 图谱 关系 学习方法 系统 | ||
1.基于对抗式注意力机制的一样本知识图谱关系学习方法,其特征在于,包括:
获取目标知识图谱中关系三元组及其对应的自然文本描述;
对目标知识图谱进行表示学习获得三元组的向量表示;
对三元组相应的文本描述进行表示学习获得文本中词向量表示;
构建带去噪注意力模块和混淆注意力模块的条件对抗式生成网络;
对条件对抗式生成网络进行优化训练,基于训练好的条件对抗式生成网络,预测未见关系ru的关系查询(eg,ru,?)所对应的目标实体;其中,?代表与实体eq对应的、未见关系ru的实体;
构建带去噪注意力模块和混淆注意力模块的条件对抗式生成网络,具体为:
构建以文本描述为输入,以关系表示向量为输出的生成器:采用三元组的文本描述作为条件输入,首先采用去噪注意力模块对文本描述进行去噪,只关注三元组描述的关系语义,将其输入到生成器中,监督生成器的特征生成;
构建三元组的向量表示与带注意力权重的关系表示向量的判别器:针对生成器的生成特征,采用混淆注意力模块增加判别器的判别难度,只选取生成特征中包含的三元组描述的关系语义;通过判别器输出判别结果;
基于上述构建的生成器和判别器,得到条件对抗式生成网络;
所述去噪注意力模块对文本描述进行去噪的过程具体为:
计算三元组表示向量xi和文本描述中每个词向量vi的余弦相似度xi,vi,得到其对应的关系注意力权重αi;
将文本描述中所有词向量乘以其相应关系注意力权重进行求和;
再通过一个全连接层即可得到文本描述的表示ti,{i=1,2,3…S};S为文本描述的个数;
所述采用混淆注意力模块增加判别器的判别难度的具体过程为:
计算三元组表示向量xi和生成向量的余弦相似度即可得到其对应的关系注意力权重βi,将注意力权重乘到关系表示向量上,通过一个全连接层,获得生成向量的新的表示T为向量的个数。
2.如权利要求1所述的基于对抗式注意力机制的一样本知识图谱关系学习方法,其特征在于,对目标知识图谱进行表示学习获得三元组的向量表示,具体为:
采用基于表示学习的方法得到对知识图谱中每个实体的向量表示,对于可见关系rs的一个三元组得到该关系实体三元组的向量表示xi,{i=1,2,3…T}。
3.如权利要求1所述的基于对抗式注意力机制的一样本知识图谱关系学习方法,其特征在于,对三元组相应的文本描述进行表示学习获得文本中词向量表示,具体为:
选取词向量表示学习模型,所述模型将训练语料中包含的|V|个词表示成一个d×|V|的词向量字典We,其中d为词向量的维度;
对于一个包含M个词语的文本描述t={w1,w2,…,wm},其每一个词语wi在整个词表中的独热编码表示为hi∈{0,1}|V|,则计算词向量词典和该词语对应的独热编码向量的乘积We×hi,即为该词语的词向量表示vi。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东财经大学,未经山东财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911105384.2/1.html,转载请声明来源钻瓜专利网。