[发明专利]一种用于知识服务的信息处理方法及系统有效
申请号: | 201410421886.7 | 申请日: | 2014-08-25 |
公开(公告)号: | CN105373546B | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 叶茂;金立峰;汤帜;徐剑波 | 申请(专利权)人: | 北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 周美华 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 知识 服务 信息处理 方法 系统 | ||
本发明所述的用于知识服务的信息处理方法及系统,获取所有或部分知识点作为知识点集合,并对知识点集合中的每个知识点,确定其语义信息,之后根据语义信息,确定知识点对应的句群集合,根据句群集合,确定对应的篇章信息,根据篇章信息,确定对应的数字资源,综合考虑了知识点的语义信息,而不是简单的通过用户输入的关键词的名称关联出相应的知识,更加贴合用户的真实需求,能够根据知识点包含的语义信息关联出与用户需求最为贴合的相应的知识,真正实现了以知识点的方式组织领域内的知识,提升了用户的体验。
技术领域
本发明涉及一种用于知识服务的信息处理方法及系统,属于电数字数据处理技术。
背景技术
知识的组织单位长期停留在文献这一层次上,这成为制约知识被有效利用的瓶颈。数字出版已成为出版业的发展趋势,人们从纸质阅读大量地转向电子阅读。电子图书、期刊、数字报刊等多样化的出版形态承载着海量的文本数字资源。然而,数字出版资源目前主要采用书籍或期刊等文档的形式组织和传播知识和信息。但随着知识经济时代的到来,人们希望获取的并非文档本身,而是直接获得文档里面的知识。因此,知识服务应运而生。所谓知识服务是指从各种显性和隐性知识资源中按照用户需求抽取相关知识,并用来解决用户问题的高级阶段的信息服务过程。这种服务其特点就在于,它是一种面向知识内容和解决方案的服务。
知识抽取是当前自然语言处理、语义Web、机器学习、知识工程、知识发现、知识管理、文本挖掘等相关领域共同关注的重点研究之一,是一个新的研究热点,主要是指从文档信息中抽取知识,通过对文档进行内容分析和处理,将文档中蕴含的知识逐条抽取出来。知识抽取是知识获取的一种方式,也是信息抽取的升华与深化。目前,以数字出版资源形式存在的知识资源已经非常丰富,但是以句段为组织单位的知识资源还很匮乏。句群是在意义和结构上有密切联系的前后连贯的句子组成的言语交际单位,是知识的一种有效表达方式。句群抽取自书籍的篇章信息(篇章是传统的知识组织方式),通过基于句群的知识抽取,可将文献处理的颗粒度从篇章层次细分到句段层次,从而彻底改变传统的知识组织和管理方式,为用户提供更好的知识服务。
同领域的知识点之间存在着关联,通过同一文本中知识点及其解释可以直接发现的关系,我们称之为“显性关系”,通过不同文本中知识点及其解释间接发现的关系,我们称之为“隐性关系”。领域百科全书作为一种数字出版资源,是对领域知识点概要信息的简单总结。领域百科全书中的知识点(也称为词条)描述了知识点名称和知识点解释,解释文本中通常会提及部分其他相关知识点。例如,在《中国大百科全书——中国历史》中,对于知识点“秦始皇”的解释为“中国统一秦王朝的开国皇帝...免除吕不韦的相职,令其徙处蜀郡...始皇三十四年,又采纳丞相李斯的建议...”(省略了部分内容,已经使用...注明)。从解释中可以看到,知识点“秦始皇”与知识点“吕不韦”有关联关系。同理,知识点“秦始皇”与知识点“李斯”也有关联关系,这些关系是存在于知识点及其解释之间的显性关系。但是,在两个知识点之间,除了显性关系,还可能存在多个间接地隐性关系,并且隐性关系可能比显性关系更具代表性。因此基于知识点的显性关系,需要进一步挖掘知识点间的隐性关系,综合考虑知识点的显性关系和隐性关系,才能对知识点关系强度做出更好的度量,为用户提供更为全面的知识服务。
因此,实现知识的组织单位由文档深化到知识点,从而获取存在于大量文档中的知识点及相关知识点间的联系,将产生极大的知识增值。以知识点形式组织的知识,能系统有效地展示一个学科或专业领域的知识概貌和内部联系。但现有技术中,仅是将用户输入的关键词作为知识点来提取出包含该关键词的句段、图片、电子书等知识,为用户提供相关的知识服务,而忽略了知识点包含的语义信息和知识点间的关联性,无法真正实现以知识点的方式组织领域内的知识。
发明内容
为此,本发明所要解决的技术问题在于现有技术中,缺少一种有效的信息处理方法,能够以知识点的方式组织领域内的知识,从而提供一种真正能够以知识点的方式组织领域内的知识的用于知识服务的信息处理方法及系统。
为解决上述技术问题,本发明的技术方案如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学,未经北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410421886.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种PDF文档注释的获取方法及装置
- 下一篇:一种水质基准计算的数据提取方法