[发明专利]一种基于社会网络分析的学术合作可持续性的预测方法在审
申请号: | 201710030918.4 | 申请日: | 2017-01-18 |
公开(公告)号: | CN106886571A | 公开(公告)日: | 2017-06-23 |
发明(设计)人: | 夏锋;王伟;崔自鑫;高桐;孔祥杰 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q10/04 |
代理公司: | 大连理工大学专利中心21200 | 代理人: | 梅洪玉,侯明远 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 社会 网络分析 学术 合作 持续性 预测 方法 | ||
技术领域
本发明涉及一种学者间学术合作可持续性的预测方法,尤其涉及一种基于社会网络分析的学术合作可持续性预测方法。
背景技术
随着科学的快速发展和科技的高速进步,越来越多的学者选择通过合作的方式共同解决复杂的科学难题。学者们可以通过合作互补优缺,提高研究的效率,缩短研究时间,使研究过程更加严谨,最终实现双赢。合作可以帮助学者更加有效地进行科学研究和科研分析。而单枪匹马的研究方式则因为个人主观思想的局限性和高错误率而逐渐被学术研究界摒弃。由于学术合作的日益广泛,人们也开始逐步了解和研究合作机制,发现合作机制中的规律。在学术界,两名学者可能有过不止一次的合作,即合作在学者间关系中具有一定的可持续性。由此,研究两名学者如何从陌生人转变为合作者的合作机制,可以预测两位学者合作的可持续性,为学者推荐更适合的合作伙伴,从而更好地促进学术合作,推动科技的进步。
精确预测学术合作的可持续性具有一定的难度。主要有以下三个原因:第一,学术类数据的数据量较为庞大,使得我们难以获得所需的全部数据。第二,合作的持续具有一定的偶然性和不确定性,并且遵循一种长尾式分布规律而非线性回归,而在时间上分布不均匀的预测模型很难建立。第三,影响学术合作可持续性的因素在当前是不确定的,同时影响因素间的相互作用也会对预测结果产生干扰。
目前,并没有明确的分析论证证明影响学者间合作可持续性的具体因素有哪些,但是学者间合作的可持续性又存在客观的个体差异。为了具体研究学者间的合作机制,我们提出了预测学术合作可持续性这一问题,并运用集成提升树的思想建立预测模型。在此基础之上,本发明提出一种基于社会网络分析的学术合作可持续性预测方法。
发明内容
本发明的目的是,基于上述问题,我们研究出一种通过人际关系网络及学者个人属性进行合作可持续性预测的方法。具体而言,我们建议从合作的持续时间和合作次数的角度来分析学术合作的可持续性,同时将可能影响合作可持续性的学者的个人属性和网络属性作为影响因素,并在真实客观的学术数据集(DBLP)上进行广泛的实验来证明我们提出方法的有效性。经过充分分析和论证影响学者间合作可持续性的影响因素后,我们提出一种新的模型构建思想,集成提升树思想,并建立预测模型,将其命名为合作可持续性预测模型,用于预测学者学术合作的可持续性问题。
一种基于社会网络分析的学术合作可持续性的预测方法,其特征在于:合作可持续性预测方法是基于合作可持续性可在早期预测的事实而设计的。而集成提升树可以用于分类和回归。模型定义两学者合作早期的时间节点为两人第一次合作之时。合作可持续性预测模型通过两个学者合作早期时社会网络的属性预测未来两个人合作的整个阶段的合作时间和合作次数。并以此来评价两学者的合作可持续性。
本发明的技术方案:
一种基于社会网络分析的学术合作可持续性的预测方法,步骤如下:
预测方法使用的合作可持续性预测模型包括数据提取模块和模型设计模块;
数据提取模块包括数据预处理和评价模块,模型设计模块包括训练模块和预测模块;
(1)数据提取模块:主要用于提取影响合作可持续性的因素;由于目前对影响合作机制的因素没有明确的结论,所以需要通过实验证明哪些因素对合作的可持续性有影响,并将这些因素作为模型的输入因素,模型通过这些输入因素,对合作的可持续性进行预测;包括数据预处理模块和评价模块;
①数据预处理模块:用于训练和测试合作可持续性预测模型的所有数据都是从DBLP数据集中提取;DBLP数据是一组由计算机科学领域的学者发表的论文组成;为了消除只做过短期科研工作的学者对处理结果产生的影响,只采用了发表过十篇以上论文的学者数据对合作可持续性预测模型进行训练;在重建学者合作数据集后,获得所有的任意两名学者之间的合作记录;
在现实社会中,有各种因素可能会推动合作的可持续性,如个人意向、主要活动地区、合作偏好和所得利益等等。而预测模型能考虑越多的影响因素所得到的预测结果也会更加精准。在数据预处理模块,提取个人属性和社会属性,共计五个影响因素的数据,并分析其对合作可持续性的影响;
所有的输入变量都被归一化到[0,1],以提高学习的效率,所使用的归一化思想如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710030918.4/2.html,转载请声明来源钻瓜专利网。