[发明专利]一种基于知识关联的主题图冲突检测方法及系统有效
| 申请号: | 201810918417.4 | 申请日: | 2018-08-13 | 
| 公开(公告)号: | CN109344293B | 公开(公告)日: | 2021-05-18 | 
| 发明(设计)人: | 杨宗凯;杜旭;李浩;林炳;付一迪 | 申请(专利权)人: | 华中师范大学 | 
| 主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/907 | 
| 代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 杨采良 | 
| 地址: | 430079 湖*** | 国省代码: | 湖北;42 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 知识 关联 主题 冲突 检测 方法 系统 | ||
1.一种基于知识关联的主题图冲突检测方法,其特征在于,所述基于知识关联的主题图冲突检测方法包括:
采用基于路径和深度的知识元关联关系的方法计算主题图中知识元间的相关性;
计算主题图中的知识元所关联的资源组间的相关性,并结合知识元所关联的资源描述信息进行计算知识元间的相似性;
利用基于路径与深度的方式计算所得出的知识元之间的相关性与利用资源组多维描述信息标签所构建词向量计算得到的相关性,计算
基于路径和深度的知识元关联关系计算主题图中知识元间的相关性中,
从信息理论的角度用公式表示结构中的主题图公式
其中,表示的知识元k1与K2在主题图中的共同性,diff(k1,k2)表示k1与k2在主题图中的差异性;
和的计算公式如下
=γ+
=β+P(k1,k2)
其中,P(k1,k2)=Rk1+Rk2,表示知识元k1和k2之间的最短路径,γ为深度调节参数,β为路径调节参数,表示k1和k2的最近公共节点的深度;将公式=γ+、=β+P(k1,k2)带入到公式中所得
;
计算主题图中的知识元所关联的资源组间的相关性,并结合知识元所关联的资源描述信息进行计算知识元间的相似性,具体包括:
1)主题图KG=把表征某知识元的组织单元中的名称、描述标签、描述内容进行分词和词性标注处理,并过滤掉停用词,只保留指定词性的单词,构建一组描述知识元的词组,此类词组都是由名词、动词、形容词组成,这些词语已经存在,构成,其中表示的某个是由知识元和知识元所关联的所有标签信息表征的集合,其中是已经保留后的关键词;
2)构建候选关键词图G=(V,E),其中V为节点集,由1中生成的候选关键词组成,然后采用共现关系(co-occurrence)构造任两点之间的边,两个节点之间存在边仅当两个节点对应的词汇在长度为N的窗口中出现,N表示窗口大小,最多共现N个单词;
3)根据TextRank算法迭代传播各个节点的权重,直至收敛;TextRank算法为:
;
4)对节点权重进行倒叙排序,得到最重要的m个关键词,作为表征关键词;
通过提取表征知识元的关键词摘要后所得到的关键词集合;如果计算知识元与的相似性,则计算关键词集合、的相似性;
单个关键词表示的相似性
=。
2.如权利要求1所述的基于知识关联的主题图冲突检测方法,其特征在于,
计算Rk与Rr的的偏差一致性,包括:
通过采用基于路径和深度的方式计算知识元组间的相似性与采用基于知识元所关联的资源组间的相似性两种方法,结合知识元所关联的资源描述信息,进行计算知识元间的相似性所计算得到的主题图中知识元与知识元之间相似性,两个知识元在主题图中所处的结构中的相对位置偏差较大,按照主题图构建的方式通过知识元和资源组表征所对比的相似性,得的最终两种相似性比值趋于1附近的值;
Rk和Rr分别表示的是基于路径与深度的方式计算所得出的知识元之间的相关性和计算主题图中的知识元所关联的资源组间的相关性;ψ表示的是整体偏差系数。
3.一种实现权利要求1~2任意一项所述基于知识关联的主题图冲突检测方法的信息数据处理终端。
4.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1-2任意一项所述的基于知识关联的主题图冲突检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810918417.4/1.html,转载请声明来源钻瓜专利网。





