[发明专利]基于Paper Rank算法的文献排序方法及装置有效
申请号: | 201810636672.X | 申请日: | 2018-06-20 |
公开(公告)号: | CN108897736B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 王则远;周旻;毕莹;孙佳星 | 申请(专利权)人: | 大连诺道认知医学技术有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
地址: | 116023 辽宁省大连市高*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 paper rank 算法 文献 排序 方法 装置 | ||
本发明实施例公开一种基于Paper Rank算法的文献排序方法及装置,能够克服传统文献排序方法具有单一性和不准确性的缺陷。方法包括:S1、对于待排序的每一篇文献的每一条句子,针对该句子枚举所有分词方案,从该句子的所有分词方案中选取最优分词方案;S2、对于所述待排序的每一篇文献,通过将该篇文献对应的所有最优分词方案代入Paper Rank算法中计算该篇文献的重要性,并按照文献的重要性对所述待排序的文献进行排序,其中,在文献的重要性的计算过程中采用加权平均的方式赋予不同属性不同的权重。
技术领域
本发明实施例涉及信息技术领域,具体涉及一种基于Paper Rank算法的文献排序方法及装置。
背景技术
随着互联网的高速发展,越来越多的信息以电子形态存储和交换,于是信息检索技术应运而生,并且仍在不断地发展和完善。文献作为记录、保存和传播已有知识成果的载体,是人类文明和社会进步的基石,也是科研工作者最重要的思想工具。那么如何在短时间内准确地检索出有价值的文献就具有非常重要的意义。传统文献检索大多按照被引次数、发表时间、搜索词出现频次等条件之一对结果进行排序。自从E.Garfield等提出引文分析以来,以引文为基础而衍生的各种科学评价指标和评价工具迅速成为科学计量学研究的热点。以SCI,EI等为代表的各种科学引文索引,建立在包含海量科技数据的引文数据库基础上,为大规模的科学评价提供了相对低成本、高效的方法。科学文献之间不是孤立的,由文献引用而形成的复杂网络中蕴含节点之间的相互关系,一篇文献的相对重要性也包含其中。因此,从网络的视角分析评价对象的重要性,可以反映其学术水平或价值,是科学评价的一种有效途径。
常见的引文分析方法有共引分析(Co-citation)、引文耦合分析(BibliographicCoupling),借助多维数据处理方法(如MDS)、知识图谱的绘制方法、计算机可视化技术、计算机图形聚类算法等,来映射和描绘学科的知识结构关系。此外,还有作者共引分析(ACA)、共词分析,虽然研究对象关系不相同,但在研究范式和方法上存在相通之处。
引文和链接具有本质上的相近之处,体现了网络模型中从一个元素到另一个元素的指向和影响作用关系。以PageRank,HITS算法为代表的基于网络结构的排序方法,在互联网络环境中取得成功的同时,也为引文网络分析带来了有益的启示。如Bergstorm提出Eigenfactor方法,采纳PageRank算法原理,并应用于期刊的排序评价。Zhou Ding等提出混合异质网络中的排序方法,并将HITS,PageRank算法的思想应用到不同类型网络节点权值的传递过程中,扩展了引文网络的模型结构。
传统文献检索存在很多不足,大多按照被引次数、发表时间、搜索词出现频次等条件之一对结果进行排序,角度单一且忽略了文献相互引用带来的价值流动,往往会出现部分文献排名过高或过低的现象,导致经常会出现排名靠前的文献利用价值不高而有价值的文献很难找的问题。
发明内容
针对现有技术存在的不足和缺陷,本发明实施例提供一种基于Paper Rank算法的文献排序方法及装置。
一方面,本发明实施例提出一种基于Paper Rank算法的文献排序方法,包括:
S1、对于待排序的每一篇文献的每一条句子,针对该句子枚举所有分词方案,从该句子的所有分词方案中选取最优分词方案;
S2、对于所述待排序的每一篇文献,通过将该篇文献对应的所有最优分词方案代入Paper Rank算法中计算该篇文献的重要性,并按照文献的重要性对所述待排序的文献进行排序,其中,在文献的重要性的计算过程中采用加权平均的方式赋予不同属性不同的权重。
另一方面,本发明实施例提出一种基于Paper Rank算法的文献排序装置,包括:
选取单元,用于对于待排序的每一篇文献的每一条句子,针对该句子枚举所有分词方案,从该句子的所有分词方案中选取最优分词方案;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连诺道认知医学技术有限公司,未经大连诺道认知医学技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810636672.X/2.html,转载请声明来源钻瓜专利网。