[发明专利]一种基于时态合作者知识图谱的合作者预测方法和预测系统在审
申请号: | 202110606169.1 | 申请日: | 2021-05-31 |
公开(公告)号: | CN115481215A | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 金栋栋;程鹏;林学民;陈雷 | 申请(专利权)人: | 华东师范大学;君烁(上海)信息科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36;G06F16/9536;G06F40/30 |
代理公司: | 上海德禾翰通律师事务所 31319 | 代理人: | 夏思秋 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 时态 合作者 知识 图谱 预测 方法 系统 | ||
1.一种基于时态合作者知识图谱的合作者预测方法,其特征在于,包括以下步骤:
步骤(1):时态合作者知识图谱的构建,对收集得到的学术关系做数据清洗,然后创建由形式为头实体,关系,尾实体的带有时间属性的时态三元组组成的时态合作者知识图谱,并放入Neo4j图数据库中存储;
步骤(2):训练基于预训练语言模型的语义编码器来挖掘时态合作者知识图谱中的实体的语义信息,作为其初始化表示;
步骤(3):如果步骤(2)中语义编码器训练轮次没有达到设定值或训练损失没有达到早停条件,则对每个实体的邻域中的时态三元组根据时态图注意力机制计算其对于中心实体的归一化注意力系数,并根据该系数加权聚合邻域信息以更新实体嵌入表示;计算三元组嵌入、计算归一化注意力系数以及加权聚合邻域信息并附加跳跃连接以更新实体嵌入表示的整个流程为单个时态图注意力层,通过训练堆叠了至少一个时态图注意力层的嵌入编码器来增强实体的嵌入表示;
步骤(4):在步骤(2)中语义编码器训练轮次达到了设定值或训练损失达到了早停条件后,给定一个三元组,将其头尾实体和关系组成三元组嵌入矩阵,训练基于多尺度卷积核策略的解码器在嵌入矩阵上进行解码得到该三元组的分数,作为其置信度;
步骤(5):在步骤(4)中解码器训练轮次到达了设定值或训练损失达到了早停条件后,给出两个已在时态合作者知识图谱中但是从未合作过的作者,根据训练过的嵌入编码器得到他们的嵌入表示,并输入到训练完成的解码器中得到其置信度,如果大于设定的阈值则预测他们之间会产生合作。
2.根据权利要求1所述的基于时态合作者知识图谱的合作者预测方法,其特征在于,利用时态知识图谱作为信息载体进行未来合作者预测,所述时态合作者知识图谱为由形式为头实体,关系,尾实体并带有时间属性的三元组组成的多关系有向图,所述实体为时态合作者知识图谱中的节点,所述关系为时态合作者知识图谱中的所述实体之间的有向边;所述未来合作者即两个从未合作过的作者在将来共同发表同一篇论文。
3.根据权利要求1所述的基于时态合作者知识图谱的合作者预测方法,其特征在于,所述步骤(1)的具体步骤包括:
步骤(1.1):所述学术关系是指包括作者之间的合作关系、论文发表的会议期刊的多元关系的集合,通过论文网站的公开数据获得;所述数据清洗是指去除出现次数过少的作者,筛选得到实体集和关系集;所述出现次数的过滤阈值可自由选择;根据学术关系中包含的合作关系、所属机构、论文主题的多元关系构建三元组,并且在三元组上附加该三元组创建的时间,所述时间包括论文发表的时间;
步骤(1.2):为了使得每个实体能够获得更远的邻居的信息,在每个实体和它的多跳邻居之间人为构建辅助有向边,使时态合作者知识图谱中的知识流动;所述更远是指长于两个实体之间的最短可达路径的长度。
4.根据权利要求1所述的基于时态合作者知识图谱的合作者预测方法,其特征在于,所述步骤(2)语义编码器的具体步骤包括:
步骤(2.1):时态合作者知识图谱中的每个实体e是由一个单词序列s组成的,即e=s=[w1,...wl,...wL],其中wl是指单词序列中的第l个单词,L是指单词序列中的单词总数;将单词序列s送入预训练语言模型BERT中获得每个单词的词嵌入[w1,...wl,...wL]=BERT([w1,...wl,...wL]),其中表示单词wl的词嵌入,dBERT表示词嵌入的维度;
步骤(2.2):对于每个实体e获得的词嵌入序列,采取平均策略将词嵌入序列转化为实体嵌入,即采用一个全连接层对获得的实体嵌入e降维,即einit=FCs(e),其中FCs表示一个全连接层,einit即为实体的初始化嵌入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学;君烁(上海)信息科技有限公司,未经华东师范大学;君烁(上海)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110606169.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:自动化接口防护方法、装置、设备及存储介质
- 下一篇:一种集成型中高频变压器