[发明专利]文献热点的可视化分析方法在审
| 申请号: | 201810523242.7 | 申请日: | 2018-05-28 |
| 公开(公告)号: | CN108959378A | 公开(公告)日: | 2018-12-07 |
| 发明(设计)人: | 戴维迪;李胜男 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程小艳 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 可视化 研究 主题网络 字段 预处理 改变数据 期刊数据 设定条件 有效分析 分析 数据源 维度 期刊 检测 改进 | ||
本发明公开一种文献热点的可视化分析方法,主要步骤包括:1)研究数据的获取及处理,具体为确定需要研究的领域,爬取领域期刊数据;提取所需研究字段,对获取的关键词字段进行预处理;2)研究主题的检测;3)可视化研究主题和主题网络。本发明从数据源进行改进,改变数据的获取方法,选定领域期刊,根据设定条件进行数据爬取,能够获得研究相关的大量有代表性数据;利用战略图与主题网络相结合的方法进行可视化,从多个维度对结果进行分析。能够进一步提高分析结果准确性,以期对未来研究趋势进行有效分析和说明。
技术领域
本发明属于文献计量学领域,具体涉及一种文献热点的可视化分析方法
背景技术
文献热点分析是一个重要的研究领域,热点研究主要通过对该领域所发表的论文或专利进行分析,其中论文是该领域研究发展的一个重要体现。目前对于文献的分析,大多是基于WOS和CNKI数据库,直接使用检索字段获取数据,然后使用可视化工具进行可视化分析。使用这种方法获取的数据量比较少,而且人为定义的检索字段可能会造成检索文献不全的问题,无法完成对整个行业知识的宏观分析,对于行业发展无法给出准确预测和分析。
现有方案一般是基于已知数据库直接检索的数据,然后使用可视化分析工具对特定字段进行统计或相关性分析。
发明内容
本发明的目的在于克服现有技术的不足,提供一种文献热点的可视化分析方法。
本发明根据领域期刊影响因子进行排序,然后依次爬取期刊数据。以文献关键词为研究对象,通过对数据预处理,建立关键词共现网络并进行分析。基于共词分析的文献计量图有助于将一个领域划分为几个子领域,通过对其关系的可视化分析,来对当前领域研究热点进行跟踪监测,对未来研究的发展趋势进行预测,指导行业发展。
本发明为解决上述背景技术中提出的技术问题,采用的技术方案是:文献热点的可视化分析方法,该方法包括如下步骤:
S1:研究数据的获取及处理:
(1)确定需要研究的领域,爬取领域期刊数据;
(2)提取所需研究字段;
(3)对获取的关键词字段进行预处理;
S2:研究主题的检测:
(1)对预处理所得的数据,使用共词分析方法来得到研究领域的研究主题,并使用可视化分析来得到领域研究热点;
(2)根据关键词的共现建立关键词共现网络,将关键词的共现频率作为边的权重,关键词作为网络的节点;
(3)使用等价指数eij计算关键词之间的相似性,对网络边的权重进行归一化:
其中,cij是两个关键词i和j共同出现的文档数量,ci和cj表示每个关键词出现的文档数量;
S3:可视化研究主题和主题网络
(1)计算网络中心性c,衡量一个主题与其它主题的交互程度:
c=10·Σekh
其中,k属于主题的关键词,h是属于其他主题的关键词;
(2)计算网络密度d,衡量主题的发展情况:
其中,i和j是属于主题的关键词,w是主题中的关键词的数量;
(3)使用网络中心性和密度画出战略图,将二维战略图进行扩展,使战略图中主题词的体积大小与关键词出现的频率成正比,主题词由频率最高的关键词决定;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810523242.7/2.html,转载请声明来源钻瓜专利网。





