[发明专利]一种基于网络表征学习的师生关系识别方法在审

专利信息
申请号: 201811362590.7 申请日: 2018-11-16
公开(公告)号: CN109543738A 公开(公告)日: 2019-03-29
发明(设计)人: 徐博;刘嘉莹;王雷;夏锋 申请(专利权)人: 大连理工大学
主分类号: G06K9/62 分类号: G06K9/62;G06F17/18
代理公司: 大连理工大学专利中心 21200 代理人: 温福雪;侯明远
地址: 116024 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明属于学术大数据挖掘技术领域,提供一种基于网络表征学习的师生关系识别方法。该方法解决了以往只能通过人工标注的方法所带来的不正确、不完全以及耗时等缺点,能够自动识别两个学者是否是师生关系。该方法首先为每个学科每年建立初次合作网络。网络的节点表示学者,边表示合作关系。建立网络的同时,该方法也为每个节点和边建立属性。同时,该方法重调学者每年论文数量,消除时间偏向;提出学科因子,实现跨学科师生关系识别。该方法提出的师生识别模型由节点编码器、边编码器以及线性回归组成,以两个学者节点属性和边属性作为输入,输出这两个学者为师生关系的概率。本发明为研究学术数据的学者们提供一个可靠的师生关系识别的方法。
搜索关键词: 师生关系 网络 节点编码器 合作关系 合作网络 节点属性 人工标注 线性回归 自动识别 编码器 大数据 学科 耗时 输出 学习 概率 挖掘 研究
【主权项】:
1.一种基于网络表征学习的师生关系识别方法,其特征在于,步骤如下:(1)构建初次合作网络通过学者们发表的文章为每个学科每年创建初次合作网络,即该合作网络中节点表示学者;如果两个节点之间有边,表示对应的两个学者之间在当年有初次合作;(2)为合作网络中的节点和边创建属性(2.1)节点属性以学者i为例,考虑表1中定义的属性作为该学者的属性;其中Coli表示从此年份开始5年内学者i的所有合作者信息;用向量表示Coli,该向量的第j位元素表示学者i与学者j合作的次数;AAi由公式(1)计算得:AAi=Yc‑Yif   (1)其中,Yc表示此时的年份,Yif表示学者i发表的第一篇文章的年份;Orgi表示学者i在当年所属的机构;NPi表示学者i在此年之前所发表的文章数量,也就是学者i与在此网络中其它学者合作之前发表的文章数量;表1:节点属性的定义(2.2)边属性表2:边属性的定义用表2中定义的属性作为学者i和学者j之间边的属性;其中ADij是学者i和学者j学术年龄差的绝对值;CTij、FTA和LFA中的次数都指的是初次合作的前8年内符合条件的文章数量;CDij所指的时长是初次合作的前8年内的合作时长,以年为单位;表示学者i和学者j初次合作后第t年的相似性,其中,1≤t≤8,初次合作算第一年;由公式(2)计算得:其中,和Pjt分别表示学者i和学者j第t年发表的文章数量;表示第t年学者i和j合作完成的文章数量;(3)基于每年文章数量的曲线,重新调整每个学者每年文章的数量,以解决每年发表的文章数量的差异对结果的影响;通过MAG数据集统计得到每年发表的文章数量近似为如下曲线:p=8.3*10‑45e0.05y+22.7*103   (3)每个学者在y年发表的文章数量PA重新量化为PA′,由公式(4)计算得:PA′=PA/τ   (4)其中,τ为曲线p的倒数,即τ=4.15*10‑46e0.05y;(4)定义并计算学科因子为了将由部分学科师生关系数据集训练的模型去识别其它学科的师生关系,使用学科因子消除各个学科之间发表的文章数量的差异;由公式(4)计算得到:其中,表示学科s在y年里发表的文章数量;<NP>y表示所有学科在y年平均发表的文章数量;|F|表示学科数量;(5)基于网络表征学习方法构建师生关系识别模型师生关系识别模型由三部分组成,分别为节点编码器、边编码器以及线性回归分类器;在识别师生关系时,师生关系识别模型去输出学术年龄长的学者j是学术年龄短的学者i的导师的概率;执行过程如下:(5.1)串联学者i的节点属性和学者j的节点属性,串联的属性表示为An,并作为结点编码器的输入,最终得到多维向量表示Dn;学者i的节点属性包括Coli、AAi、Orgi和NPi;学者j的节点属性包括Colj、AAj、Orgj和NPj;(5.2)将学者i和学者j的合作边属性Ae作为边编码器的输入,最终得到多维向量表示De;合作边属性Ae包括ADij、CTij、CDij、FTA、LFA和(5.3)串联Dn和De,输送到线性回归分类器中;(5.4)如果线性回归分类器输出的结果越大,说明学者j是学者i的导师的概率越大;如果涉及到跨学科师生关系识别时,先通过学科因子重新调整每个学科每年发表的文章数量;再用已知学科的师生关系数据集去训练师生关系识别模型;最后用训练好的模型去识别跨学科师生关系;(6)师生关系图谱构造出整个学科的师生关系图谱,探索不同学科之间以及同一学科不同年份之间师生合作的差异。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811362590.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top