[发明专利]一种基于论文引用关系的黄金引用作者发现方法有效
申请号: | 201810769032.6 | 申请日: | 2018-07-13 |
公开(公告)号: | CN109063023B | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 吴晨生 | 申请(专利权)人: | 北京市科学技术情报研究所 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/335 |
代理公司: | 北京元中知识产权代理有限责任公司 11223 | 代理人: | 王明霞 |
地址: | 100044 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 引用 论文引用 引用关系 作者信息 网络 论文数据库 检索技术 网络模型 线性映射 标定 发现 递归 构建 群体 删除 收敛 输出 修订 帮助 | ||
本发明涉及论文检索技术领域,具体地说,涉及一种基于论文引用关系的黄金引用作者发现方法,包括如下步骤:首先,在论文数据库中选定论文群体范围,获取引用关系以及作者信息;其次,依据论文群体中论文的相互引用关系及作者信息构建初始论文引用网络模型;再次,标定初始论文引用属性,建立自引修订引用系数,生成排除自引的论文他引网络;然后,将论文他引网络通过线性映射生成作者引用网络;最后,采用递归删除的方式缩小作者引用网络的范围,直至结果收敛,输出得到黄金引用作者。本发明提供的论文作者发现方法易于实施,且可有效排除论文自引和低质低效的他引干扰,以帮助研究者快速地准确地识别出黄金引用作者。
技术领域
本发明涉及论文检索技术领域,具体地说,涉及一种基于论文引用关系的黄金引用作者发现方法。
背景技术
论文是科技人才科研成果产出的重要形式之一,在科技人才评价中,发表论文的数量与水平是科技人才评价中的重要依据与内容。而随着技术发展速度逐渐加快,时至今日,人类产生的所有印刷材料的数据量早已超过200PB,面对如此海量的数据,想要从中检索出较为重要的文献及相关信息变得愈发困难。
一般认为论文被引数量与作者的影响力呈正相关关系,被引用量越大说明论文作者的影响力越大。虽然这种方法简单快速,但不是十分合理,原因在于论文引用包括作者在后来的论文中自我引用(自引)和他人的引用(他引)两种,以论文引用进行论文作者科技成果评价时,广受诟病的行为就是不去除论文自引,这种行为生成了较大的论文引用量,模糊了论文作者的影响力。因此,应将以“论文引用次数”来评价论文作者的现状,改为以“论文他引次数”来评价论文作者。
此外,施引论文的作者是有等级区别的,但一般作者、优秀作者、权威作者的引用情况,在基于论文引用次数进行论文作者评价时,并没有加以区分;同时领域内的权威作者对其所在的研究领域非常熟悉,他们又能够鉴别出该领域的优秀作者和优秀论文,因此面对这类权威作者文献的引用关系时,更应当加以区别对待。
有鉴于此,特提出本发明。
发明内容
本发明旨在提供一种基于论文引用关系的黄金引用作者发现方法,较为快捷并且准确地实现了论文作者的发现过程,以便使用者甄选出影响力较大的作者。
为实现上述目的,本发明具体采用如下技术方案:
本发明提供了一种基于论文引用关系的黄金引用作者发现方法,包括如下步骤:
首先,在论文数据库中选定论文群体范围,获取引用关系以及作者信息;
其次,依据论文群体中论文的相互引用关系及作者信息构建初始论文引用网络模型;
再次,标定初始论文引用属性,建立自引修订引用系数,生成排除自引的论文他引网络;
然后,将论文他引网络通过线性映射生成作者引用网络;
最后,采用递归删除的方式缩小作者引用网络的范围,直至结果收敛,输出得到黄金引用作者。
上述方法中,在论文网络映射生成作者引用网络前,先排除论文引用次数中的自引,克服了自引在作者评价中的干扰。之后,采用层层剥离的方式排除作者引用次数统计中低质低效的他引干扰,依据论文间的引用次数,综合考虑论文自引干扰和分等级作者引用等因素,对论文引用次数进行统计修订,提高了黄金引用作者识别的准确性。其中,作者群体可以是按照主题、领域、学科和/或年代划定范围,也可以是按照设定的检索策略划定范围,也可以是数据库中的全部论文。
根据上述方法,所述初始引用网络模型为:G=(V,E),G=(V,E)是由|V|=N个论文节点和|E|=M条边所组成的一个有向网络;其中,G代表论文群体中论文以及论文间引用关系的集合,V代表论文群体G中的论文集合,E代表论文群体G中论文间的引用关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市科学技术情报研究所,未经北京市科学技术情报研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810769032.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种服务器系统信息的提取方法
- 下一篇:一种社交平台用户影响力计算方法及装置