[发明专利]一种改进的基于领域本体的概念相关度计算方法在审
| 申请号: | 201610833721.X | 申请日: | 2016-09-20 |
| 公开(公告)号: | CN106611040A | 公开(公告)日: | 2017-05-03 |
| 发明(设计)人: | 金平艳 | 申请(专利权)人: | 四川用联信息技术有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 610054 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 改进 基于 领域 本体 概念 相关 计算方法 | ||
技术领域
本发明涉及语义网络技术领域,具体涉及一种改进的基于领域本体的概念相关度计算方法。
背景技术
目前,针对词语相关度计算的研究很多,计算方法和算法也比较丰富,或是基于词语共现几率计算相关度,或是根据词语语义词典的相似度来得到相关度,或是基于维基百科层次结构计算相关度。这其中不乏比较经典和优秀的算法,但也存在着一些问题,例如,这些方法或是不能全面考虑词语语义,或是未语义概念间的关联关系的特性分析相关度。领域本体相对于计算机处理文本,出现地较晚。随着知识量的指数级增长,很难有哪部语义词典能够完整地覆盖所有范围。本体作为表示某专业领域的知识数据库,其构成结构非常清晰,类似于一棵树,更复杂的领域本体会是图形结构。尽管会出现图形结构,但是领域本体中存在着非常明显的层次结构。概念间的相关度不等同于概念相似度,考虑了基本属性关系、路径距离与路径数量、密度与深度等影响因子,也考虑本体中存在的特殊关联关系,即相关度不仅受到相似度的影响,还与本体概念间的关联程度有关。如工业”与“信息化”在信息化没有现在如此普及时,工业领域中还少见信息化这个概念,但是随着信息化进程的加快,以信息化促进工业化成为时代口号,为大多数所接受。为了满足上述需求,本发明提供了一种改进的基于领域本体的概念相关度计算方法。
发明内容
针对于即考虑了本体间的基本属性关系、路径距离与路径数量、密度与深度等影响因子,又考虑本体中存在的特殊关联关系来计算本体概念相关度问题,本发明提供了一种改进的基于领域本体的概念相关度计算方法。
为了解决上述问题,本发明是通过以下技术方案实现的:
步骤1:利用七步法或循环获取法构建专业领域本体数据库。
步骤2:考虑了本体间的基本属性关系、路径距离与路径数量、密度与深度等影响因子计算两本体概念(g1,g2)间的相关度。
步骤3:考虑本体中存在的特殊关联关系,计算本体概念(g1,g2)间的相关度RE关联(g1,g2)。
步骤4:综合上述步骤2、步骤3,得到本体概念(g1,g2)间的最终相关度RE最终(g1,g2)
本发明的有益效果是:
1、为语义扩展提供良好的理论基础。
2、与经典相关度计算公式对比。此方法取得了比不考虑关联性的相似度计算方法取得了更好的效果。
3、为实现语义扩展能够提高信息检索的查全率和查准率提供良好的理论基础。
附图说明
图1为一种改进的基于领域本体的概念相关度计算方法结构流程图。
图2为本体概念领域模块语义树形图。
具体实施方式
为了解决即考虑了本体间的基本属性关系、路径距离与路径数量、密度与深度等影响因子,又考虑本体中存在的特殊关联关系来计算本体概念相关度问题,结合图1-图2对本发明进行了详细说明,其具体实施步骤如下:
步骤1:利用七步法或循环获取法构建专业领域本体数据库。
步骤2:考虑了本体间的基本属性关系、路径距离与路径数量、密度与深度等影响因子计算两本体概念(g1,g2)间的相关度,其具体计算过程如下:
步骤2.1)构造基于基本属性关系对两本体概念(g1,g2)相似度的影响函数RE属性(g1,g2)
两本体概念(g1,g2)相似度与属性相似度成正比,与属性权重也成正比。
路径为g1→J1→…→Jn→g2
假设g1、J1、…、Jn、g2的属性个数各为
每个属性对相应概念的影响权重是不同的,按照权重系数分别对概念属性进行排序,对每个概念属性取前i个属性权重值。
这里
即得下列属性权重矩阵(n+2)×i:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川用联信息技术有限公司,未经四川用联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610833721.X/2.html,转载请声明来源钻瓜专利网。





