[发明专利]一种用于知识服务的信息处理方法及系统有效
| 申请号: | 201410421886.7 | 申请日: | 2014-08-25 |
| 公开(公告)号: | CN105373546B | 公开(公告)日: | 2019-03-29 |
| 发明(设计)人: | 叶茂;金立峰;汤帜;徐剑波 | 申请(专利权)人: | 北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36 |
| 代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 周美华 |
| 地址: | 100871 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 知识 服务 信息处理 方法 系统 | ||
1.一种用于知识服务的信息处理方法,其特征在于,包括如下步骤:
获取所有或部分知识点,作为知识点集合;
对于所述知识点集合中的每个知识点,确定所述知识点的语义信息,具体包括:采用关键词扩展方法,将知识点的名称作为初始关键词进行扩展,得到知识点对应的扩展关键词ar及扩展关键词出现的次数vr;获取知识点的属性集Ar={(a1,u1),(a2,u2),…,(ak,uk)}作为所述知识点的语义信息,其中ar为知识点的属性参数,ur为所述属性参数对应的权重,其中ur根据扩展关键词出现的次数vr得到,r=1,2,…,k,k为属性数目;
根据所述语义信息,确定所述知识点对应的句群集合,具体包括:获取初始句群;根据初始句群长度与期望长度的比较结果F=期望长度/(初始句群长度+冗余值),对初始句群设置权重阈值,F大于或等于1时的权重阈值小于F小于1时的权重阈值;在扩展初始句群时,将待扩展句子的权重与权重阈值进行比较,根据比较结果对初始句群进行扩展;将对需要进行扩展的初始句群扩展后得到的最终句群输出,完成知识抽取,得到与所述知识点的属性集对应的句群集合;将所述句群集合与对应的知识点相关联;
根据所述句群集合,确定所述知识点对应的篇章信息;
根据所述篇章信息,确定所述知识点对应的数字资源。
2.根据权利要求1所述的用于知识服务的信息处理方法,其特征在于,所述关键词扩展的处理包括:
将知识点名称作为初始关键词,根据预先给定的初始关键词进行检索,检索获得关键词;
将检索获得的关键词作为下一次检索的基础,通过关键词迭代的方式进行循环检索;
当一次检索得到的关键词与前一次检索得到的关键词误差在预设误差阈值内时,检索结束,将本次检索得到的关键词确定为扩展关键词ar,并记录扩展关键词出现的次数vr。
3.根据权利要求1所述的用于知识服务的信息处理方法,其特征在于,
从电子书全文索引库获取所述初始句群,且初始句群中包括一个以上句子。
4.根据权利要求1所述的用于知识服务的信息处理方法,其特征在于,根据所述句群集合,确定所述知识点对应的篇章信息的过程,包括:
根据所述句群集合,查询到其在电子书全文索引库中对应的篇章信息作为所述知识点对应的篇章信息;
根据所述篇章信息,确定所述知识点对应的数字资源包括如下步骤:
根据所述篇章信息,查询到其在电子书全文索引库中对应的数字资源作为所述知识点对应的数字资源;
将所述数字资源与对应的知识点相关联。
5.根据权利要求1所述的用于知识服务的信息处理方法,其特征在于,所述获取所有或部分知识点作为知识点集合之后,所述方法还包括:为知识点关联图片。
6.根据权利要求5所述的用于知识服务的信息处理方法,其特征在于,所述为知识点关联图片的过程包括:
在图片库中搜索图片标题与知识点名称相对应的图片集合,将所述图片集合与知识点相关联。
7.根据权利要求1-6任一所述的用于知识服务的信息处理方法,其特征在于,所述获取所有或部分知识点作为知识点集合之后,所述方法还包括:
构架以某一知识点为中心的知识信息网。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学,未经北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410421886.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种PDF文档注释的获取方法及装置
- 下一篇:一种水质基准计算的数据提取方法





