[发明专利]一种基于图数据库的知识森林构建方法有效
| 申请号: | 201810068490.7 | 申请日: | 2018-01-24 |
| 公开(公告)号: | CN108304519B | 公开(公告)日: | 2020-08-18 |
| 发明(设计)人: | 刘均;任若清;段海梦;刘文强;郑元浩;石磊;杨宽 | 申请(专利权)人: | 西安交通大学 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/34;G06F16/31;G06F40/279;G06F40/30 |
| 代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
| 地址: | 710049 陕*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 数据库 知识 森林 构建 方法 | ||
1.一种基于图数据库的知识森林构建方法,其特征在于,包括构建实例化知识主题分面树的步骤、生成知识主题间认知关系的步骤以及存储知识森林数据的步骤;
构建实例化知识主题分面树的步骤为:
采集不同课程的数据,构建课程数据集;根据知识主题及分面数据集,构建知识主题分面树;对课程知识碎片数据集基于层次进行多次分类,确定课程知识碎片和知识主题分面树叶子节点之间的映射关系,由此构建出实例化知识主题分面树;
构建实例化知识主题分面树时,首先对课程内每一个知识主题,依据该主题的分面及该主题分面间的语义关系,构建以该知识主题名为树根、以该主题各分面名为树干的知识主题分面树;然后对课程知识碎片基于知识主题和分面信息进行多次分类,建立知识主题分面树叶子节点与课程知识碎片之间的映射关系集合,从而构建得到实例化知识主题分面树;
构建实例化知识主题分面树具体包括以下步骤:
1.1将采集到的课程相关数据分类构建数据集,分别为知识主题数据集Topic,分面数据集Facet,分面间语义关系集合的数据集FRelation,知识碎片数据集Fragment;
1.2对构建好的知识主题数据集Topic中的每一个知识主题,构建三元组KT=(ku,TF,R),其中根节点ku表示知识主题,TF表示知识主题的分面集合,表示知识主题的分面间语义关系集合,开始TF和R为空;对知识主题ku,遍历数据集Facet和FRelation,将ku的所有分面加入集合TF,把ku所有分面间语义关系加入集合R;为每个知识主题ku,以该知识主题的三元组KT=(ku,TF,R)为基础,构建以主题名ku为树根、主题各分面TF为树干的主题分面树;
1.3对知识碎片数据集Fragment中每一个碎片fg,构造长度为Topic数组大小的向量,向量每一维对应Topic中相同位置的主题,每一维的值置为fg碎片内容中出现该维对应主题名的次数;向量构造完成后,将fg分类到向量值最大的维对应的知识主题;类似的,将fg继续按知识主题分面分类;
1.4对已构建的知识主题分面树集合KFT,根据对知识碎片数据集Fragment中每一个知识碎片的分类,得到知识主题分面树叶子节点Leaf(KFT)与知识碎片间的对应关系MP,即从而完成实例化知识主题分面树的构建,实例化的知识主题分面树表示为三元组KTI=(KFT,Fragment,MP);
生成知识主题间认知关系的步骤为:
以经过预处理的各知识主题下知识碎片文本内容为输入,输出课程内任意两个知识主题间具有认知关系的可能性;根据人工设置的阈值,若两个知识主题间具有认知关系的可能性大于阈值,则在这两个知识主题间生成认知关系;以课程数据目录为补充数据源对认知关系进行补充,最终生成课程内知识主题间所有的认知关系;
存储知识森林数据的步骤为:
制定知识森林数据三元组存储格式,将知识森林数据按照对应存储格式构建为三元组形式并存入图数据库,从而得到存储各课程数据的知识森林数据库;
存储知识森林数据时,首先根据所生成知识森林数据的特点,制定知识森林数据三元组存储格式;其次将课程下的知识主题、分面、知识碎片和认知关系按对应的格式进行转换,构建得到三元组形式的知识森林数据;最后将构建好三元组的数据存入图数据库;
存储知识森林数据具体包括如下步骤;
3.1基于资源描述框架,结合知识森林数据特点,制定知识森林数据三元组存储格式;
3.2对课程domain,遍历其知识主题数据集Topic,对其中每一个主题ku,构建三元组格式的知识主题数据<ku,subject_to,domain>;
3.3对碎片数据集Fragment中每一个碎片fg,确定碎片fg对应的知识主题ku和分面facet,构建三元组格式的知识碎片数据<ku,facet,fg>;
3.4根据所生成的知识主题间认知关系数据,对其中每一条认知关系构建三元组格式的认知关系数据<ku1,dependence,ku2>;
3.5将构建好的三元组知识森林数据存入图数据库,完成知识森林数据的构建。
2.根据权利要求1所述基于图数据库的知识森林构建方法,其特征在于:构建实例化知识主题分面树时,以课程书籍和百科类、社区问答类网站内容作为信息来源。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810068490.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多媒体文件处理方法、服务器及存储介质
- 下一篇:智能电视搜索平台及搜索方法





