[发明专利]基于命名实体库的在线知识地图有效

专利信息
申请号: 201410199271.4 申请日: 2014-05-12
公开(公告)号: CN103955531B 公开(公告)日: 2017-06-30
发明(设计)人: 李华康;过敏意;沈耀 申请(专利权)人: 南京提坦信息科技有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京联瑞联丰知识产权代理事务所(普通合伙)11411 代理人: 曾少丽
地址: 210000 江苏省南京市南京溧水经济开发区柘宁东*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 命名 实体 在线 知识 地图
【说明书】:

技术领域

发明涉及一种制作知识地图的方法,具体涉及一种基于命名实体库的在线知识地图。

背景技术

知识地图最早由英国情报学家B·C·布鲁克斯在《情报学基础》中提出情报学的真正任务是组织、加工和整理客官知识,绘制以各个知识单元为节点的知识地图。随着知识管理研究的发展,知识地步作为一种组织和管理的重要工具得到了广泛地研究,被应用于知识审计、知识组织、知识门户、知识评价、知识体系等诸多方面。目前国内外在知识地图的生成技术方面主要有以下几个方面:

迪吉科技有限公司的贺嘉生在2002提出了一种“知识地图的建立、编辑、检索与对应网络上信息内容的编辑方法”【CN1448863A】,依据不同的知识范畴,建立一套向现有知识地图中新增知识节点名称、描述、父节点、型态识别码的方法,接住输入节点识别码修改或删除知识地图中的节点名称及节点描述,最终利用知识地图进行搜寻、分类、编辑、检索,使所汇集的知识、信息图书馆化。

T.H.Ong等人在2005年提出了“Newsmap:一种在线新闻的知识地图(Newsmap:A knowledge map for on line news)”(Decision Support System,Vol.39,pp.583-597,Apr.2005),通过生成层次化知识地图的可视化技术成功的展示了商业和医疗的新闻知识。

Duen-Ren Liu等人在2008年提出一种“复合电子服务的知识地图:一种基于挖掘与建议耦合的系统平台(Knowledge maps for composite e-services:A Mining-based system platform coupling with recommendations)”(Expert System with Application,34,pp.700-716,2008)使用系统记录中抽取知识模式,辅以数据挖掘技术构建知识地图。

上海交通大学的王英林等人在2011年提出了一种“基于本体的知识地图绘制系统”【CN102184194A】包括本体知识库、知识地图标示层和知识地图管理层。该技术以本体数据库的图形结构作为基本数据结构,通过对知识概念和知识关联的抽取表达来实现对不同知识地图的创建需求,并以XML形式输出到知识地图显示系统中。其中本体知识库存储通用知识及知识见的关系,知识地图表示层和本体知识库项链,并用抽象的知识节点代替知识库中的具体知识概念,知识关联引入复合运算,知识地图管理层与知识地图标示层项链管理抽象知识和复合知识关联的定义并存储到独立的数据库中实现知识地图的生成。

华中科技大学的金海教授等人在2012年提出了“一种基于维基百科构建概念型知识地 图的方法”【CN102609449A】从维基百科全文数据中抽取知识文档并分析其知识信息存入数据库,以知识节点格式描述将数据库中的知识转化为概念知识节点和类别知识节点,并建立索引提供基于关键字的知识检索。

铭传大学的卢阳正等人在2012年提出的“制作知识地图的方法”【CN103106232A】以词汇为中心,知识地图包含词汇(t)、多个关联词汇(s)及相互间权重(w),通过建立关联知识集{(t,s,w)}提供查询服务。通过词汇关联和知识集筛选,用K-mouns算法将关联词汇分组,输出知识地图。

这些知识地图的生成技术需要一个特定的文档集或者关系数据库中抽取出特定方面的信息,每次构建知识地图时需要重新收集和挖掘必要的信息,面对快速发展的互联网信息很难达到高效地添加新知识,实现高效地知识地图的更新。

发明内容

本发明的目的在于克服现有技术存在的以上问题,提供一种一种基于命名实体库的在线知识地图,本发明从海量新增网页文本信息中抽取命名实体,自动地建立实体节点与节点之间的关联关系,根据知识节点及其之间的关联关系建立知识地图,并能高效地实现知识地图的更新。

为实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:

基于命名实体库的在线知识地图的生成方法,包括以下步骤:

步骤1)爬取网页,向整个互联网爬取网页信息,得到互联网数据集;

步骤2)抽取命名实体,对互联网数据集的内容进行识别和抽取,得到命名实体;

步骤3)寻找属性词,遍历步骤1中的互联网数据集,寻找命名实体与属性对,建立与命名实体相关的属性集合;

步骤4)量化信息,量化属性集合中属性词与命名实体之间的关联关系,使命名实体关联属性词集;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京提坦信息科技有限公司,未经南京提坦信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410199271.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top