[发明专利]从词典中包含的术语定义自动地生成本体的设备和方法无效
申请号: | 200910129759.9 | 申请日: | 2009-03-26 |
公开(公告)号: | CN101546339A | 公开(公告)日: | 2009-09-30 |
发明(设计)人: | P·拉尔韦;F·卡雷 | 申请(专利权)人: | 阿尔卡特朗讯 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06F17/21 |
代理公司: | 北京市金杜律师事务所 | 代理人: | 朱海波;唐文静 |
地址: | 法国*** | 国省代码: | 法国;FR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 词典 包含 术语 定义 自动 生成 本体 设备 方法 | ||
技术领域
本发明涉及文档的分析,并且更具体地,涉及用于自动地生成在文档分析或处理的环境内使用的本体(ontology)的方法和设备。
背景技术
根据本发明,此处术语“自动地生成”的意思是能够从术语定义自动地生成和完成本体。
此外,此处术语“本体”描绘在给定的域内操作的术语(或概念)以及这些术语(或概念)之间的关系的一种形式描述(或数据模型)。本体特别用于推论出在域内存在的对象。
正如本领域技术人员所已知的,越来越多的应用使用本体以便允许或参与或促进对文档的分析或处理。这特别是下面的情形:根据规范自动地构建可执行应用的设备,或用于自动地在CRM(“客户关系管理”)中处理进入的电子邮件的文本分析器,或能够从自然语言请求中找到相关信息的“语义搜索引擎”。
因此,在个性配置中,令全面和精确描述可能包含在文本中的术语(或概念)的本体易于被分析或处理是相当重要的。
现今,在专用工具的辅助下可以人工地构建本体,专用工具例如“Protege”(其具体地在因特网地址“http://protege.standford.edu”处描述)。这不是令人满意的,因为每当文本(或文档)包括的术语(或概念)在本体中还不存在对等体时,该文本的一部分不能够被正确地分析或处理,直到专家人工地在本体中构建相应的条目。类似地,如果在文本中使用该术语(或概念)的同义词(或下义关系,或反义词...),则该文本的整个意义将被误解,原因是缺少该术语的相关定义或与其他的有用术语的关系。
发明内容
因此,本发明的目的是通过允许本体的自动生成来改善这种情况。
为此,提供一种用于自动地生成本体的方法,包括在每次接收到必须针对其生成本体的术语时:
-确定该接收到的术语在词典中的定义,接着
-从该确定的定义中提取相关术语,接着
-确定这些提取的相关术语中的每个相关术语在词典中的定义,接着
-针对接收到的术语和提取的相关术语的每个确定的定义,构建至少一个逻辑子句,该逻辑子句表达其包含的相关术语对之间的关系,这些构建的逻辑子句定义接收到的术语的本体。
根据本发明的方法可以包括可单独或组合考虑的附加特性,并且特别地:
-在构建了逻辑子句后,可以将它们转换成选择的本体语言;
可以通过转换表来对逻辑子句进行转换;
可以从至少包括OWL(“本体Web语言”)和RDF(“资源描述框架”)的语言组中选择本体语言。
本发明也提供一种用于自动地生成本体的设备,并且该设备包括分析装置,其设置成在每次接收到必须针对其生成本体的术语时,用于:
-访问词典以确定该接收到的术语的定义,接着
-从该确定的定义中提取相关术语,接着
-访问词典以确定每个提取的相关术语的定义,接着
-针对接收到的术语和提取的相关术语的每个确定的定义,构建至少一个逻辑子句,该逻辑子句表达其包含的相关术语对之间的关系,这些构建的逻辑子句定义接收到的术语的本体。
根据本发明的设备可以包括可单独或组合考虑的附加特性,并且特别地:
-其可以进一步包括转换装置,用于将构建的逻辑子句转换成选择的本体语言;
转换装置可以被设置用于通过转换表来对逻辑子句进行转换;
·其可以进一步包括存储装置,用于存储转换表;
可以从至少包括OWL和RDF的语言组中选择本体语言。
本发明也提供一种计算机软件产品,其包括例如上面介绍的设备。
附图说明
在研究以下的详细说明书和附图后,本发明的其他特征和优势将变得明显,其中附图1示意性地图示出根据本发明的设备的实施方式的例子。
附图不仅用于完善本发明,而且如果需要,也用于解释本发明的定义。
具体实施方式
本发明的目的在于提供一种设备(D)和相关方法,旨在从在词典中包含的术语定义自动地生成本体。
本发明针对以形式方式来描述在任意类型的域内操作的术语(或概念)以及这些术语(或概念)之间的关系的任意本体。
应该注意,根据本发明的设备D可以是例如旨在分析或处理文本或文档的设备或应用的一部分,或者连接到该设备或应用。因此,这样的设备D可以是由软件模块或电子电路(或硬件模块)或硬件和软件模块的组合构成的计算机电子产品。
正如在图1中示意性图示地,根据本发明的设备D至少包括分析模块AM。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿尔卡特朗讯,未经阿尔卡特朗讯许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910129759.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种对位机构及背光源组装治具
- 下一篇:前挂式附属眼镜及其桥接装置