[发明专利]改进的基于语义距离求解本体概念语义相似度的计算方法在审
申请号: | 201610834938.2 | 申请日: | 2016-09-20 |
公开(公告)号: | CN106610946A | 公开(公告)日: | 2017-05-03 |
发明(设计)人: | 金平艳 | 申请(专利权)人: | 四川用联信息技术有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610054 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 改进 基于 语义 距离 求解 本体 概念 相似 计算方法 | ||
技术领域
本发明涉及语义网络技术领域,具体涉及一种改进的基于语义距离求解本体概念语义相似度的计算方法。
背景技术
随着本体在信息检索、人工智能等领域的广泛应用,面向本体的概念相似度计算成为本体研究的一大热点。目前领域本体中概念相似度的研究主要是利用概念上下位关系进行计算,但这并没有完整反映出概念的语义信息。传统的基于本体的概念语义相似度计算方法主要分为两种:一种是基于信息论的方法,该方法利用信息论来计算两个概念共享信息的程度,具有较高的理论严谨性,但是只能粗略地量化概念之间的语义相似度,不能实现概念语义相似度的细致区分;另一种方法是基于语义距离的方法,该方法以概念之间路径的长短作为衡量语义距离的长短,通过计算两概念之间的语义距离来实现概念语义相似度的计算,该方法简单、直观,但忽略了影响语义距离的其他很多因素。针对信息论方法的缺陷,引入了语义距离来克服了信息论方法语义区分不细致问题,在基于语义距离方法中,概念语义相似度不仅与语义距离有关,而且还受概念在本体树中的层次深度、密度影响,为了提高求解语义相似度的准确度同时解决各类多继承问题,本发明提供了改进的基于语义距离求解本体概念语义相似度的计算方法。
发明内容
针对信息论方法的缺陷,引入了语义距离来克服了信息论方法语义区分不细致问题,在基于语义距离方法中,概念语义相似度不仅与语义距离有关,而且还受概念在本体树中的层次深度、密度影响,为了提高求解语义相似度的准确度同时解决各类多继承问题,本发明提供了一种改进的基于语义距离求解本体概念语义相似度的计算方法。
为了解决上述问题,本发明是通过以下技术方案实现的:
步骤1:初始化本体概念领域模块。
步骤2:计算基于改进的信息论方法得到两本体概念(g1,g2)间的语义距离d1。
步骤3:计算基于语义距离得到两本体概念(g1,g2)间的距离因子d2。
步骤4:综合步骤2、步骤3,构造两本体概念(g1,g2)语义相似度sim1(g1,g2)。
步骤5:根据两本体概念节点(g1,g2)对应深度D(g1)、D(g2)与密度,构造两本体概念语义相似度sim2(g1,g2)。
步骤6:综合上述步骤,得到最终两本体概念间的语义相似度sim(g1,g2)。
本发明的有益效果是:
1、相比较传统的基于信息论方法、基于语义距离方法求解语义相似度,此方法准确度更高。
2、该方法即克服了信息论方法语义区分不细致问题,又使得语义距离计算具有一定的理论严谨性。
3、综合了基于信息论以及语义距离方法,得到的结果更加准确。
4、解决了本体树中节点的多继承问题。
5、此计算语义相似度的方法在量化概念上更接近专家的经验值。
6、更好的提高了本体推理的效果。
7、具有更广泛的应用研究价值。
附图说明
图1为改进的基于语义距离求解本体概念语义相似度的计算方法结构流程图。
图2为本体概念领域模块语义树形图。
具体实施方式
针对上述问题本发明提出了一种改进的基于语义距离求解本体概念语义相似度的计算方法。
为了解决信息论方法的缺陷,引入了语义距离来克服了信息论方法语义区分不细致问题,在基于语义距离方法中,概念语义相似度不仅与语义距离有关,而且还受概念在本体树中的层次深度、密度影响,为了提高求解语义相似度的准确度同时解决各类多继承问题,结合图1对本发明进行了详细说明,其具体实施步骤如下:
步骤1:初始化本体概念领域模块。
步骤2:计算基于改进的信息论方法得到两本体概念(g1,g2)间的语义距离d1,其具体求解过程如下:
步骤2.1)分别求解其共同父节点在在树状层次结构中的信息量值I(pr)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川用联信息技术有限公司,未经四川用联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610834938.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种改进的本体概念语义相似度计算方法
- 下一篇:一种新的中文自动分词算法