[发明专利]一种改进的基于信息论的概念语义相似度计算方法在审
申请号: | 201610833571.2 | 申请日: | 2016-09-20 |
公开(公告)号: | CN106610941A | 公开(公告)日: | 2017-05-03 |
发明(设计)人: | 金平艳 | 申请(专利权)人: | 四川用联信息技术有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610054 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 改进 基于 信息论 概念 语义 相似 计算方法 | ||
技术领域
本发明涉及语义网络技术领域,具体涉及一种改进的基于信息论的概念语义相似度计算方法。
背景技术
现今,语义相似度计算被广泛应用于信息检索、语义web、自然语言处理等领域。由于本体能够将领域中的各种概念和关系进行显示地、形式化地表达,因此本体在概念语义相似度计算中发挥重要的作用。传统的基于本体的概念语义相似度计算方法主要分为2种:一种是基于信息论的方法,该方法利用信息论来计算2个概念共享信息的程度,具有较高的理论严谨性,但是只能粗略地量化概念之间的语义相似度,不能实现概念语义相似度的细致区分;另一种方法是基于语义距离的方法。为了提高基于信息论方法求解概念语义相似度准确度,本发明提供了一种改进的基于信息论的概念语义相似度计算方法。
发明内容
针对于如何提高基于信息论方法求解概念语义相似度的准确度问题,本发明提供了一种改进的基于信息论的概念语义相似度计算方法。
为了解决上述问题,本发明是通过以下技术方案实现的:
步骤1:初始化本体概念领域模块。
步骤2:求解其共同父节点在在树状层次结构中的信息量值I(pr)。
步骤3:分别求解两本体概念(g1,g2)在树状层次结构中的信息量值I(g1)、I(g2)。
步骤4:基于信息量,可以得出两本体概念间的语义相似度sim(g1,g2)。
本发明的有益效果是:
1、相比较传统的基于信息论方法求解语义相似度,此方法准确度更高。
2、此计算语义相似度的方法在量化概念上更接近专家的经验值。
3、更好的提高了本体推理的效果。
4、具有更广泛的应用研究价值。
附图说明
图1为一种改进的基于信息论的概念语义相似度计算方法结构流程图。
图2为本体概念领域模块语义树形图。
具体实施方式
为了提高基于信息论方法求解概念语义相似度的准确度问题,结合图1对本发明进行了详细说明,其具体实施步骤如下:
步骤1:初始化本体概念领域模块。
步骤2:分别求解其共同父节点在在树状层次结构中的信息量值I(pr),其具体计算过程如下:
基于信息内容的计算相似度方法主要是通过衡量概念所包含的信息量来计算相似度。概念是对其祖先节点的继承,是祖先节点的又一次细化,所以可通过祖先节点包含的信息量来衡量两个概念的共享信息。
求解其共同父节点在树状层次结构中的信息量值I(pr)
根据图2,得出两本体概念(g1,g2)共同父节点在树状层次结构中每层出现的概率值p(pr)
p(pr)=(p1(pr),p2(pr),…,pk(pr))
上式k为两本体概念(g1,g2)共同父节点在树状层次结构中的层数。
E[p(pr)]为两本体概念(g1,g2)共同父节点在树状层次结构中的概率均值。
步骤3:分别求解两本体概念(g1,g2)在树状层次结构中的信息量值I(g1)、I(g2),其具体求解过程如下:
求解两本体概念的在树状层次结构中的信息量值I(g1)、I(g2)
同理,根据图2,得出两本体概念(g1,g2)在树状层次结构中每层的概率值p(g1)、p(g2)
p(g1)=(p1(g1),p2(g1),…,pi(g1))
p(g2)=(p1(g2),p2(g2),…,pj(g2))
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川用联信息技术有限公司,未经四川用联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610833571.2/2.html,转载请声明来源钻瓜专利网。