[发明专利]一种基于网络表征学习的师生关系识别方法在审
申请号: | 201811362590.7 | 申请日: | 2018-11-16 |
公开(公告)号: | CN109543738A | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 徐博;刘嘉莹;王雷;夏锋 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/18 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 温福雪;侯明远 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 师生关系 网络 节点编码器 合作关系 合作网络 节点属性 人工标注 线性回归 自动识别 编码器 大数据 学科 耗时 输出 学习 概率 挖掘 研究 | ||
本发明属于学术大数据挖掘技术领域,提供一种基于网络表征学习的师生关系识别方法。该方法解决了以往只能通过人工标注的方法所带来的不正确、不完全以及耗时等缺点,能够自动识别两个学者是否是师生关系。该方法首先为每个学科每年建立初次合作网络。网络的节点表示学者,边表示合作关系。建立网络的同时,该方法也为每个节点和边建立属性。同时,该方法重调学者每年论文数量,消除时间偏向;提出学科因子,实现跨学科师生关系识别。该方法提出的师生识别模型由节点编码器、边编码器以及线性回归组成,以两个学者节点属性和边属性作为输入,输出这两个学者为师生关系的概率。本发明为研究学术数据的学者们提供一个可靠的师生关系识别的方法。
技术领域
本发明属于学术大数据挖掘技术领域,尤其涉及一种基于网络表征学习的师生关系识别方法。
背景知识
近年来,关于学术的数据量在显著地增加,具体的表现有学者数量和每年发表的论文数量有呈指数地增加。巨大的数据量也开始吸引了学者们去分析和利用这些学术数据。在大学术数据方面,一个被广泛研究的方向就是去研究学者的合作行为,这其中一种典型的合作行为就是师生合作行为。以往大量的研究有表明师生合作是一个双赢的合作:学生可以从导师那里得到学术指导和研究基金的支持;导师也可以从与学生的合作中进一步地提升自己的学术能力以及可以获得额外的研究基金。在学术大数据分析中利用师生关系有利于大量相关的研究,比如学者学术生涯的分析、学者合作行为的分析和团队关系的识别等。
以往学者们如果想要获取师生关系,只能通过一种人工标注的方法。现有的网站,比如Mathematics Genealogy Project、Neurotree and The Academic Family Tree等,有通过人工上传的方式标识出了部分师生关系。然而这种获取师生关系的方式主要存在以下两个问题:
(1)数据不完全和不准确。现有的这些网站做包含了单个学科或部分学科师生关系,无法获取所有学科的师生关系。即使在包含的学科内,也没有该学科的所有师生关系。特别对于像计算机这类发展较快的学科,每年会新产生大量的师生合作的文章。人工上传的方式肯定会存在时间滞后的问题,这导致无法获取最新的师生关系数据。同时,人工的方式肯定会存在数据不准确的现象。
(2)虽然这些师生关系的数据是公开的,但学者们如果想要获取这些数据需要从对应的网站上爬取下来,这会耗费大量的时间,并且在后期数据清理时会产生错误的结果。
针对以上两个主要的问题,我们设计了一种基于网络表征学习的师生关系识别算法。该算法只要输入两个学者的各自属性以及合作属性,就可判断这两个学者是否为师生关系。
发明内容
本发明的主要目的是针对以上问题,设计一个能够自动识别师生关系的模型。该模型考虑了每个学者的属性和对应的合作属性,同时解决了不同领域和不同时间内发表的文章数量差异。
本发明的技术方案有:
(1)基于学者们的初次合作构建初次合作网络,即该网络中的所有合作都表示两个学者的初次合作。网络中的节点表示学者,边表示其对应的两个学者存在合作。同时基于学者的合作属性、发表的论文以及机构信息去构建节点和边的属性。
(2)基于每年文章数量的曲线,重新调整每个学者每年文章的数量,以解决每年发表的文章数量的差异对实验结果的影响。
(3)提出了并计算学科因子,实现跨学科师生关系识别。提出的学科因子解决每年在每个学科所发表的论文数量差异的影响,因此可以用用部分学科的师生关系数据集训练好的模型去识别所有学科的师生关系。
(4)基于网络表征学习方法构建师生关系识别模型。该模型通过两个编码器分别为成对的两个节点属性和边学习一个多维的向量表示。串联这两个向量作为多维的特征值,通过线性回归为每组特征值进行0-1分类。输出的结果越大,说明是师生的概率越大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811362590.7/2.html,转载请声明来源钻瓜专利网。