[发明专利]一种基于语义本体的案例表示方法无效
| 申请号: | 201010104649.X | 申请日: | 2010-02-02 |
| 公开(公告)号: | CN102141993A | 公开(公告)日: | 2011-08-03 |
| 发明(设计)人: | 向阳;陈千;王栋;张波;张蕴婧;王光亮;孙继鹏 | 申请(专利权)人: | 同济大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵继明 |
| 地址: | 200092 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 语义 本体 案例 表示 方法 | ||
技术领域
本发明涉及案例的表示方法,尤其是涉及一种基于语义本体的案例表示方法。
背景技术
传统的基于关键字的表示方法不能真正表达文本的语义信息,而且主观性很强,关键字标注工作量大。后来的基于词频的文本表示方法虽然部分强调术语的主要性,但是不能完全反映该术语在一篇文档中的重要性。由于本体能够描述概念的内涵及概念与概念之间的语义关系,并具有良好的概念层次结构和对逻辑推理的支持,因此在信息检索领域,特别是在基于语义和知识的检索中得到了广泛的应用。本体是共享概念模型的明确的形式化规范说明,是概念化的精细描述,亦可以将本体看作是知识的集合,概念是现象的抽象模型。现有的各种本体无论其在表达上采用的究竟是何种语言,在结构上都具有相似性,大多数本体描述的都是个体(实例)、类(概念)、属性以及关系。个体(实例)即基础的、底层的对象,也即实例;类是集合(sets)、概念、对象类型或者说事物的种类,本发明称之为概念;属性是对象(和类)所可能具有的属性、特征、特性、特点和参数,利用属性可以描述一个概念,也即概念可以用属性来表达;关系则指类与个体之间的彼此关联所可能具有的方式,最典型的关系即父子关系。
本体可以分为三种,领域本体(domain ontology)所建模的是某个特定领域,或者现实世界的一部分,它所表达的是那些适合于该领域的那些术语的特殊含义;上层本体是指一种由那些在各种各样的领域本体之中都普遍适用的共同对象所构成的模型,目前,存在着几部现成可用的标准化上层本体,包括都柏林核心、WordNet;表示本体则指将具体的一个集合用领域本体表示出来,并构建成一棵表示本体树出来,如将一篇文档按照某个领域本体的标准构建成一棵本体树,这棵本体树就称之为该文档的表示本体。
随着那些依赖于领域本体的系统的扩展,它们往往需要将不同的领域本体合并成一部更为通用的表达形式。对于本体设计者来说,这就提出了一项富有挑战性的难题。在同一领域内,由于文化背景、受教育程度以及意识形态的不同所造成的,对于该领域感知(perceptions)情况的不同,或者因为所采用的表达语言的不同,还可能出现不同的本体。
当前,对于那些并非依据同一部基础本体所编制的本体的合并工作,在很大程度上还是一种手工过程,因而既耗费时间又成本高昂。那些利用同一部基础本体所提供的一套基本元素来规定领域本体元素之含义的领域本体,则可以实现自动化的合并。目前,存在着多项针对本体合并方面的通用技术方法的研究工作,但这个方面的研究在很大程度上依然还处于理论层面。用于编纂本体的软件编辑器称为“本体编辑器(ontology editor)”,有时又称为“本体论编辑器”。Protégé就是其中之一,本发明所手动创建的本体就是使用Protégé工具来生成的。而本发明所使用的本体包括领域本体和表示本体,其中领域本体可以是各种领域的。包括营销、医药、卫生、环保等等。在后面的具体实施方法中本发明将以营销领域本体为例子阐述如何创建领域本体和如何进行表示本体的构建。
发明内容
本发明的目的就是为了克服上述现有方法存在的缺陷而提供一种能最大程度地减少语义缺失问题并较好的支持案例语义相似度计算的基于语义本体的案例表示方法。
本发明的目的可以通过以下技术方案来实现:
一种基于语义本体的案例表示方法,其特征在于,使用本体的四元组这种结构化的形式来表达非结构化的案例,支持案例的形式化推理和检索,支持案例的相似度计算以及案例库的自动构建,该方法包括以下步骤:
1)构造基于案例所属领域的知识本体,该知识本体包括概念集、属性集、实例集与关系集;
2)根据构造的知识本体对给定的案例进行分词,并得到一个概念集;
3)对所述的概念集的属性进行解析并扩展,得到基于概念集的属性集;
4)从领域本体的扩展概念集中的隐藏概念得出与概念集相关的关系集;
5)案例通过概念集、属性集、实例集、关系集的语义表示;
6)通过案例之间的相似度计算方法来建立案例表示模型。
所述的步骤1)的构造知识本体包括以下步骤:
11)在领域本体创建的初始阶段,列举出所有概念,不考虑所列举概念之间的意思是否重叠与这些概念以何种方式表达,所述的方式包括类、属性与实例;
12)步骤11)中已产生领域中大量的概念,按照一定的逻辑规则对这些概念进行分组,形成不同的工作领域,在同一工作领域的概念,对其中的每一个概念的重要性进行评估,选出关键性术语,摒弃那些不必要或者超出领域范围的概念,得到领域本体的框架结构;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010104649.X/2.html,转载请声明来源钻瓜专利网。





