[发明专利]一种基于表示学习和竞争理论的学者推荐及合作预测方法有效
申请号: | 201810853249.5 | 申请日: | 2018-07-30 |
公开(公告)号: | CN109145087B | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 孔祥杰;闻琳燕;夏锋;张晨薇;刘晓钟 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/289;G06F40/247 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 梅洪玉;刘秋彤 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 表示 学习 竞争 理论 学者 推荐 合作 预测 方法 | ||
本发明提供一种基于表示学习和竞争理论的学者推荐及合作预测方法,属于计算机软件领域。用庞大的学术网络来满足推荐的需求,通过表示学习技术对作者发表的论文以及学者间的网络关系进行分析,借助竞争理论解决时间冲突以获得推荐结果并进行合作预测。该方法从微软数据集获取有效数据并进行预处理,构建动态的基于论文内容的学者个性相似度计算模型,构建基于合作网络的学者环境相似度计算模型,构建竞争理论的处理模型,利用预处理的数据集对以上模型进行训练,根据训练获得的个性相似度产生初步的推荐列表,利用环境相似度削弱过于相似的源学者和目标学者,同时利用竞争理论的处理模型消除时间冲突,从而实现有效学者推荐和下一次合作对象预测。
技术领域
本发明属于计算机软件领域,涉及一种基于表示学习和竞争理论的学者推荐及合作预测方法。
背景技术
跨越多领域的跨学科研究在过去几十年中快速增长,学者之间的科学合作变得越来越重要和必要。然而,从大的学术数据中找到最有价值的合作者往往是个极大的挑战。表示学习的目的是为网络中的每一个节点分配一个某个线性空间中的向量,也就是我们常说的N维向量,向量与向量之间的关系保留了原网络中对应的节点之间在结构上的关系。word2vec于2013年由Google发布,集成CBOW和Skip-Gram模型,提供了用于计算单词向量表示的高效实现,它将文本语料库作为输入并输出单词向量。在此基础上发展而来的Doc2vec是表示学习中有效的处理文本的方法,集成PV-DM和PV-DBOW模型,可以用于从不同长度的文本片段中获取固定长度的特征表示。Node2vec是2016年提出的用于网络中可伸缩特征学习的半监督算法,优化了一个自定义的基于图形的目标函数,返回的特征表示最大化保留d维特征空间中节点的网络邻域的可能性,并使用二阶随机游走方法为节点生成网络邻域。
梯度下降值更新技术是求解机器学习算法的模型参数,即无约束优化问题时最常用的方法之一。本发明中利用梯度下降迭代求解,得到趋于稳定的因子特征向量,该向量表示了各个因子在整体作用下影响力的权重。
传统上,学者合作推荐的核心是为学者创建静态的推荐列表,该推荐严重依赖于源学者与候选学者之间的相关性,这不利于新合作的建立。此外,推荐候选学者还不足以保证实现真正的合作。给出静态推荐列表会导致同一个候选人被同时推荐给多位学者。然而,由于时间的限制,这位候选人无法接受众多的合作者。所以传统的给出静态推荐列表的推荐方法已经不能满足学者们的需求。
合作预测是通过现有数据对未来合作的一个推测。目前大多数的预测方法都是基于学者的出版物来进行的,但是这不利于跨领域合作的建立。此外,对于下一次的合作对象的来源,既可能是加强旧合作的最有价值的推荐者(Most Valuable Recommenders,MVCs),也可能是建立新合作的最有潜力的推荐者(Most Potential Recommenders,MPCs)。合作网络中包含这两种来源,并且可以比基于出版物的预测方法给MPCs更多的机会,同时保证了预测对象之间较高的合作意向。因此结合合作网络和论文内容进行合作预测可以得到更高的准确性。
发明内容
本发明提供了一种基于表示学习和竞争理论的学者推荐及合作预测方法,解决传统静态推荐和单一来源合作预测导致的效果不佳的问题,实现了动态合作推荐和合作预测,保证了结果的准确性。
本发明的技术方案:
一种基于表示学习和竞争理论的学者推荐及合作预测方法,具体步骤如下:
步骤一、从微软数据集中获取有效数据并进行预处理,然后划分为训练集和测试集;
所述的有效数据包括:论文中的学者信息、标题信息、摘要信息、关键词信息和引用信息;
所述的预处理是:依据学者信息获取学者群体,过滤合作数低的学者,得到有效学者群体,建立有效学者群体的四个因子文件;利用有效学者群体的四个因子文件建立无向合作网络,获取每个学者的最邻近网络节点邻居;四个因子包括论文的标题、摘要、关键词和引用;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810853249.5/2.html,转载请声明来源钻瓜专利网。