[发明专利]一种基于场论的本体中概念相似度计算方法有效
| 申请号: | 201410490635.4 | 申请日: | 2014-09-23 |
| 公开(公告)号: | CN104239546B | 公开(公告)日: | 2021-11-23 |
| 发明(设计)人: | 王国新;王祎楠;阎艳;师鑫 | 申请(专利权)人: | 北京理工大学 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/36;G06K9/62 |
| 代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;黄灿 |
| 地址: | 100081 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 场论 本体 概念 相似 计算方法 | ||
本发明提供了一种基于场论的本体中概念相似度计算方法,基于场论,采用场的特性描述本体,把本体定义的语义结构转化为语义场以构建语义场模型;对本体包含的概念间语义关系进行规范化;本体利用信息量对概念的特征进行描述,得到概念的语义引力元和语义距离;最后应用所述语义场模型得到概念相似度。本发明全面考虑了概念相似与差异两方面对概念相似度计算的影响,改进了现有方法孤立考虑两者之一的缺陷。
技术领域
本发明属于检索技术领域,尤其涉及一种基于场论的本体中概念相似度计算方法。
背景技术
利用关键字的检索从字符的表现形式上进行匹配,只能检索用户所表达的显性信息,无法对用户表示的隐性信息进行处理。语言学的分类结构就可以很好的解决这一问题,而语言学分类结构的一个应用最广泛的应用就是本体。本体就可以通过概念及概念间的关系,有效地理解用户输入的信息,从而达到语义检索的目的。这一过程中最核心的步骤就是依据本体中概念相似度对用户输入概念进行拓展。
本体中概念相似度的计算方式主要分为两种,分别是基于概念间关系的边方法和基于节点的方法,基于节点的方法又可以分为基于节点信息量的方法和基于节点的特征的方法。
以上两种类型的方法,都只考虑了概念相似度的一种角度。节点的方法从概念相同的部分去分析概念的相似度,边的方法从概念差异的角度衡量相似度,两种方法都没有综合考虑概念中相同和差异部分对相似度的影响。使用边的方法时,主要是采用权重衡量概念的差异,主要由密度权重、深度(层次)权重、类型权重、信息量权重,前三种权重因子不能准确的反映关系所连接概念的实际差异,并且这四类权值差异的根本原因在于本体内概念信息量的分布。所以,无论是边方法还是节点的方法,都依据不同概念的信息量之间的关系。综合考虑概念共享和差异的信息量,就能准确的得到概念的相似度。
以本体中某一概念为参考点,其他概念依据与该概念信息量中的差异得到与参考点的距离,分布在以参考点为原点的一维空间中。当分别以本体内每一概念为参考点后,既可以把本体中的概念分布在一个N维空间内,N为本体中概念的数量,进而得到任意两概念的几何距离。
发明内容
本发明的目的在于提供一种基于场论的本体中概念相似度计算方法,旨在解决现有基于本体语义分析中的对概念特征描述不完整和对关系的作用描述不准确的问题。
本发明是这样实现的,一种基于场论的本体中概念相似度计算方法,包括以下步骤:
S1、基于场论,采用场的特性描述本体,把本体定义的语义结构转化为语义场以构建语义场模型;
S2、对本体包含的概念间语义关系进行规范化;
S3、本体利用信息量对概念的特征进行描述,得到概念的语义引力元和语义距离;
S4、应用所述语义场模型得到概念相似度。
优选地,在步骤S1中,所述语义场模型用函数定义为:
式中,m(c1)、m(c2)为概念C1、C2的引力元,对于语义场,引力元m1=m2;r为概念C1、C2间的语义距离,f为引力常数。
优选地,在步骤S2中,所述语义关系包括上下位关系、等同关系、与关系和交叉关系、或关系、非关系、矛盾关系和互补关系。
优选地,在步骤S3中,所述信息量为根据某一概念的父类和子类的信息量共同决定,且用概念在本体中发生的频数来表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410490635.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:色浆的分散研磨系统
- 下一篇:一种光伏背板及光伏背板的制备方法





