[发明专利]知识谱系的可视化方法有效
申请号: | 201210022047.9 | 申请日: | 2012-01-31 |
公开(公告)号: | CN102779143A | 公开(公告)日: | 2012-11-14 |
发明(设计)人: | 刘禹;刘禹;杨一平 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 谱系 可视化 方法 | ||
技术领域
本发明属于信息处理技术领域,具体涉及一种利用年代和知识共现关系组织和展现专业领域知识点和发展脉络的知识谱系的可视化方法。
背景技术
科学研究活动立足于对已有知识的搜集、整理和积累,着眼于对未知世界的探索和钻研。知识的创造、传播和使用在推动科学和经济发展方面的作用越来越突出,21世纪已经逐步跨入知识经济阶段。具体表现为:一方面,科学技术知识在不断地增加和深化,知识的广度和深度都达到了一个前所未及的程度;另一方面,随着社会化分工和专业化程度的提高,经验知识,即隐性知识,也在不断地发展,并有着借助高级知识管理工具显性化的趋势。知识不仅是一种资源,从更广泛的含义上来说也是一种生产要素和资本,因此知识管理已经成为一门专门的学科加以研究。
知识创新源于知识积累,它们是创新和继承的关系。对于一个学科、一个专业、一个岗位,都存在大量的已有知识。只有迅速掌握这些已有知识,在头脑中建立该学科、该专业、该岗位的知识框架,才能够在已有知识基础上进行知识检索、知识关联和知识创新。特别是对于初学者,是否能够快速掌握知识框架直接关系到知识创新的效率和结果。
学科知识框架是以学科知识为对象,显示科学研究的发展进程与结构关系的一种层次化、序列化、图形化的分类体系,反映了知识元或知识群之间网络、结构、互动、交叉、演化或衍生等诸多复杂的关系。人们可以依靠学科知识框架,透视学科知识体系中各个领域的结构,构造复杂知识网络,预测学科技术前沿的发展趋势等。
在传统研究中,研究者为了了解一个学科领域发展的整体状况,必须查阅该领域的几乎所有文献。这个工作既费时又困难,并且由于受到研究者自身主观判断影响,每个人在文献查阅之后所获得的结论都是不同的。此外,随着时间的推移和信息量的增长,新的科学文献不断产生,学科知识框架也在不断地动态调整,研究领域的衍生和融合持续发生,想了解学科领域发展的整体状况这一目标变得越来越难实现。因此需要有一种客观、科学、高效的新方法来构建学科知识框架的结构。不可否认,个人和组织是知识系统中的活动主体,但是,知识工具在知识管理中也起到了重要的辅助与支撑作用。计算机的高速处理能力加快了人们获取和处理知识的速度和深度,大容量的存储和方便的检索使得人们能够积累数量巨大、种类多样的知识,网络化消除了空间限制,知识来源更加丰富。
共现分析是将各种信息载体中的共现信息定量化的分析方法,这种方法基于一种假设,即两个词之间的关联强度可以用同时感知到两词的相对频率来衡量。在这种假设下,就可以利用共现分析研究词汇之间的关联度,挖掘词汇之间的语义关系。根据共现分析对象的不同,还可分为引文共现分析和关键词共现分析。其中引文共现是指两篇文献同时被别的文献引用,可以提供分析对象之间由引文关系形成的相对位置信息和相互关系的亲疏程度;关键词共现是指两篇(或多篇)科学文献中存在一个(或多个)相同的关键词,主要用于从内容上了解文献之间的内在联系和相应作者及研究机构在研究方向上的类同及相关程度。在计算机技术的辅助下,共现分析以其方法的简明性和分析结果的可靠性,成为支撑信息内容分析研究过程的重要手段和工具。
然而,在当前诸多基于共现分析的应用中,均没有考虑时间因素,即在分析过程中忽略了研究对象间的继承和发展关系,而这种关系对于研究者了解学科领域发展整体状况是非常有价值的。对于一个专业领域而言,学科知识框架至少应该包含该学科的研究主题关联和发展脉络两个因素,其中研究主题关联通过论文中的关键词共现关系体现,而发展脉络则可以通过年代来划分层级,由此形成可视化的学科知识谱系,可以为使用者的知识创新提供更多的辅助参考。
通常来说,专业领域的使用者在进行知识检索时,首先需要先确定明确的检索关键词。由于现有的检索系统尚不能支持基于语义的查询,因此只能根据使用者输入的检索关键词进行基于布尔逻辑的匹配查询。如果使用者输入的检索关键词过泛或过窄,就很可能会出现检索结果过多或过少的情况。一旦出现这种情况,则需要使用者自行调整检索关键词,重新检索。很多专业领域的初学者由于不了解该专业领域的知识体系,在调整检索关键词时缺乏参考和指导,往往会造成知识检索的效果不佳。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是在海量文献信息中抽取出有价值的知识点,并按照时间顺序建立谱系关系进行可视化展示,从而快速、科学地协助使用者了解这些文献中所包含的研究主题和发展脉络关系,使背景知识前景化,解决使用者,特别是专业领域的初学者由于缺乏专业背景知识而造成的检索效果不佳的问题。
(二)技术方案
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210022047.9/2.html,转载请声明来源钻瓜专利网。