[发明专利]一种基于学术异构网络的学者影响力评估方法在审
申请号: | 201611242445.6 | 申请日: | 2016-12-29 |
公开(公告)号: | CN106778011A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 孔祥杰;张君;刘鑫童;周金梦;宁兆龙;夏锋 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 大连理工大学专利中心21200 | 代理人: | 温福雪,侯明远 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 学术 网络 学者 影响力 评估 方法 | ||
技术领域
本发明涉及学术领域中基于学术大数据对学者影响力进行评估的方法,尤其涉及一种在论文-学者异构网络下基于时间函数的学者影响力评估方法。
背景技术
科研活动是人类活动中不可忽视的一部分,人类的发展也离不开科学研究的飞速发展。科研活动是计算社会科学关注的一个重要方面。典型的科研活动是以科研工作者为主体,通过他们在学术期刊、会议上发表学术论文来完成的。学术影响力是衡量科研主体的工作质量和重要性的评价指标,正确评价一名科研人员的学者影响力可以为科研基金的审批、科研奖项的评估等提供参考依据。但现有的评估方法往往是简单的基于学者的总被引用次数或者简单的论文合著网络,而这些方法都没有考虑到论文与学者间的影响力的相互增强作用以及时间对论文影响力的影响。
发明内容
本发明的目的主要针对上述现有研究的一些不足之处,提出基于论文-学者异构网络下基于时间函数的学者影响力评估方法,通过对论文的价值评估加入时间因素,更准确的衡量论文的重要程度,并将其应用到论文-学者异构网络中,在异构网络下对学者影响力进行准确评估。
本发明的技术方案:
一种基于学术异构网络的学者影响力评估方法,步骤如下:
1)通过论文引用网络以及改进的PageRank算法,计算论文基于时间感知的重要性分值
首先根据真实数据集中某一领域待评估论文的相互引用关系构建论文的有向引文网络,有向引文网络中边的方向从引用论文指向被引用论文;根据每篇论文随着时间变化在每一年份的平均被引频次,不断积累的,是一个逐渐增加的过程这一特点以及论文在单个年份被引用的次数,从平均情况来看,是随着时间不断减小这一趋势,本方法使用加入时间因素的改进PageRank算法计算论文基于时间感知的重要性。
使用如下公式定义一篇论文的已发表年限age:
age=Tc-Tp
其中,Tc为当前的年份,Tp为该论文发表的年份;
基于时间函数的改进PageRank算法公式如下:
其中,PR(pi)表示论文pi的PageRank值,pj表示引用论文pi的文献,PR(pj)表示论文pj的PageRank值,agei表示论文pi的已发表年限,agej表示论文pj的已发表年限;对待评估论文在发表时间上的重要性做归一化处理,f(age)是时间函数,且函数的值随着age增加而减小,f(agei)表示论文pi的时间权重,f(agej)表示论文pj的时间权重,表示待评估论文时间权重的加和;L(pj)为论文pj所引用的所有论文的总数量;d为阻尼系数,同PageRank中一样,设为0.85;在时间函数上取值越大的论文(即发表年份越近的论文),取得的论文重要性分值越大;论文pi从指向它的论文(引用pi的论文)获得分值;m是引用论文pi的文献的总数量;
2)将步骤1)中得到的论文基于时间感知的重要性分值代入论文-学者异构无向网络,作为论文在该网络中的初始权值
根据待评估论文和学者信息构建论文-学者异构无向网络,该网络中的边代表学者与其发表的全部论文的对应关系;将步骤1)中得出的基于时间感知的论文重要性分值作为论文-学者异构无向网络中论文的初始权值进行初始化;将每名学者的初始权值设置为1/n,其中n是全部学者数量;
3)在步骤2)中建立的论文-学者异构无向网络上,通过论文与学者之间的随机游走模型计算学者的影响力,由此将论文的影响力作用于学者
随机游走模型如下:假设论文-学者异构无向网络中学者的数量为Na,论文的数量为Np;则所有学者初始的分值(RW)是相同的,设为1/Na;所有论文初始的分值(RW值)是相同的,设为1/Np;具体如下:
Step 1:根据如下公式更新学者的RW值:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611242445.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用