[发明专利]一种基于主题图的知识聚合方法及系统有效
| 申请号: | 201810917658.7 | 申请日: | 2018-08-13 |
| 公开(公告)号: | CN109086434B | 公开(公告)日: | 2021-07-13 |
| 发明(设计)人: | 李浩;杜旭;林炳;杨娟;马燕峰 | 申请(专利权)人: | 华中师范大学 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/30 |
| 代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 杨采良 |
| 地址: | 430079 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 主题 知识 聚合 方法 系统 | ||
1.一种基于主题图的知识聚合方法,其特征在于,所述的基于主题图的知识聚合方法包括:
通过标准知识库构建主题图:主题图基于标准知识库的元素知识元构建;构成知识元的父节点知识元组由知识元构成,再由众多父节点知识元组组合成多层父节点,构成以某个主题为基础的主题图;
进行主题图的相似度计算:进行直接关联关系的知识元与知识元的关联权重计算、知识元与学习资源的关联权重计算;进行聚合关联关系的知识元组与知识元的关联权重计算、知识元组和知识元组间的关联权重计算;
进行主题图的差异化程度计算:进行个性化主题图偏差程度的定义和主题图之间相似性的计算;
进行主题图的相似度计算中,知识元与学习资源的关联权重计算,包括:
自动关联方法:
其中R,K表示经过特征提取映射到语料库中的学习资源向量和知识点向量;首先将待关联的学习资源和知识点映射到语料库中,形成词频向量,然后对该向量进行特征化提取如TF-IDF特征提取以及LSA特征提取,将处理后的向量利用向量余弦公式计算两者间的相似度;
众智关联方法:
其中m表示不同用户标注的关联度,Credit表示不同用户的置信度;用户的置信度与用户标注的准确率有关,标注正确的数量越多,用户贡献越多,用户的置信度会提高,反之用户的置信度会减少;
学习资源与知识元的关联度计算方法进一步包括:
Relation(knowledge,resource)=k1*PeopleRelation+k2*AutoRealtion
PeopleRelation表示众智方式计算得到的关联度,AutoRelation表示自动方式计算得到的关联度,k1,k2表示不同的权重系数,取值为0-1;学习资源与知识元间的关联权重为上述两者关联度 的加权和;根据关联权重进行排序,取得与该知识元最相关的学习资源,进行学习资源层面的聚合。
2.如权利要求1所述的基于主题图的知识聚合方法,其特征在于,
知识元组与知识元的关联权重计算方法:
得到与用户手动关联知识元最相关的其他知识元,关联权重记为R(N1,A),根据知识元计算方法还计算出R(N2,A),R(N3,A),将这些关联权重之和记为该知识元与对应知识元组的关联权重,
对计算得到知识元与元组间的关联度进行排序,得出与该知识元组最相关的知识元;
知识元组与知识元组的关联权重计算方法:
知识元组间的关联权重计算方法如下所示:
其中N,M表示两个知识元组中所包含的知识元,知识元组间的关联权重即为各自所包含的知识元间的关联权重之和。
3.如权利要求1所述的基于主题图的知识聚合方法,其特征在于,
进行主题图的差异化程度计算包括:
Deviation(TopicGraph1,TpoicGraph2)=1-Similarity(TopicGraph1,TopicGraph2)的计算;
Deviation(TopicGraph1,TopicGraph2)表示的是主题图TopicGraph1和TopicGraph2的整体主题图所聚合知识与资源内容的偏差程度;采用1-Similarity(TopicGraph1,TopicGraph2)表示偏差程度,相似度的反面;Similarity(TopicGraph1,TopicGraph2)表示主题图TopicGraph1和主题图TopicGraph2的相似程度。
4.一种实现权利要求1~3任意一项所述基于主题图的知识聚合方法的信息数据处理终端。
5.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1-3任意一项所述的基于主题图的知识聚合方法。
6.一种实现权利要求1~3任意一项所述基于主题图的知识聚合方法的基于主题图的知识聚合系统,其特征在于,所述基于主题图的知识聚合系统包括:
主题图构建模块,用于通过标准知识库构建主题图;
主题图相似度计算模块,用于进行主题图的相似度计算:进行直接关联关系的知识元与知识元的关联权重计算、知识元与学习资源的关联权重计算;进行聚合关联关系的知识元组与知识元的关联权重计算、知识元组和知识元组间的关联权重计算;
差异化程度计算模块,用于进行主题图的差异化程度计算,进行个性化主题图偏差程度的定义和主题图之间相似性的计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810917658.7/1.html,转载请声明来源钻瓜专利网。





