[发明专利]一种基于本体学习的Web服务语义提取方法无效

申请号：	200810232198.0	申请日：	2008-11-07
公开（公告）号：	CN101398858A	公开（公告）日：	2009-04-01
发明（设计）人：	齐勇;王坚;沈林峰;罗元盛;徐东红	申请（专利权）人：	西安交通大学
主分类号：	G06F17/30	分类号：	G06F17/30;H04L29/08
代理公司：	西安通大专利代理有限责任公司	代理人：	张震国
地址：	710049***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于本体学习 web 服务语义提取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种Web服务语义提取方法，尤其涉及一种基于本体学习的Web服务语义提取方法。

背景技术

随着Web服务技术的日趋成熟，业界开始广泛使用Web服务作为新的分布式软件构件，然而Web服务的广泛使用也使得网络上可用的Web服务数量急剧增加，如同Web一样，用户对Web服务的查找、访问以及维护变得越来越困难。

目前，Web服务基本上都采用WSDL文件描述，并有UDDI(统一描述、发现和集成方法)技术支持Web服务的发布、存储和查找。这种技术主要依靠服务的名字和描述进行关键字查找，它丢失了许多服务描述文件中原有的信息，用户查询服务的效率较低，无法实现Web服务的自动化，更不能满足服务自动组合的需求。Web服务急需一种新的方式。

为此，研究者们针对提高Web服务的高效性和准确性展开了研究，这些研究主要从两个不同的方向考虑。一类是为Web服务引入语义网技术，采用本体对服务的属性进行描述，保证服务语义的精确和一致性，同时在服务的查找过程中采用语义推理，弥补了关键字查找不能区分同名异义和异名同义的缺点，但并没有统一的本体模型和很好的语义Web服务开发工具，因此在工程实践中存在一定困难，一直没有得到很好的推广。另一类研究则建立在目前的现实状况之上，使用标准的WSDL语言进行服务。这类研究主要使用WSDL文件中的关键字和XML文档的结构对服务进行聚类分析。虽然它们中也提到了基于语义的匹配，但是它们通常只能提取概念而无法获得概念之间的关系，这与目前使用本体的语义描述方法还存在着相当大的差别。而本体学习的方法可以从一定程度上解决上述问题。

综上所述，虽然Web服务已经有许多相关的研究，但是在现实中实用化的技术很少，Web服务应用的实际情况和前沿理论研究之间还存在巨大的鸿沟，如何解决现实问题并且向前推动Web服务技术的发展应该成为现在研究的重要内容。

发明内容

本发明的目的在于克服上述现有技术的缺点，提供了一种基于本体学习的Web服务语义提取方法，本发明能够实现从Web服务描述文件中自动获取本体，并以此为基础为Web服务添加语义，从而减少程序开发人员手工加入语义的负担，提高服务效率。

为达到上述目的，本发明采用的技术方案是：

1)读取需要解析的WSDL文件，建立类型集合并初始化一个空本体集合用于暂存从该WSDL文件中获取的本体，进入步骤2)；

2)从类型集合中取出一个未处理标签，查找本体集合中是否存在与当前要处理的标签同名的本体，如果存在则进入步骤4)，否则以该标签作为本体的名字构造一个新的本体对象并将其加入本体集合，进入步骤3)；

3)首先分析该标签的语法结构，根据其对应的语义关系建立相应的本体以及本体之间的关系，并将新建立的本体加入本体集合；然后在类型集合中查找该标签对应的文档节点，分析其文档结构，如果存在子元素则对子元素标签进行步骤2)处理，之后根据文档结构对应的语义关系建立本体之间的关系；

4)如果类型集合中还存在未处理类型，取该类型的标签进入步骤2)，否则依次取本体集合中的本体进入步骤5)；

5)从本体集合中取一个未存储本体，在本体库中查找是否存在与该本体同名的本体，如果存在则合并这两个本体，进入步骤7)；否则将此本体存入本体库，进入步骤6)；

6)取出与该本体具有相同祖先或者与该本体包含有相同本体的本体，依次取出这些本体与该本体进行比较，根据比较结果建立这些本体的关系，进入步骤7)；

7)如果本体集合中还存在未存储本体，进入步骤5)，否则进入步骤8)

8)解析WSDL文件中的服务相关信息，根据操作输入输出对应的类型参数为服务添加语义信息。

本发明步骤3)具体过程如下：

3.1预处理：将标签进行分词处理，得到一个有序的英文单词词组，然后再查找其中每个单词词性；

3.2如果存在介词，则根据介词的位置将本体分割成小段，如果标签第一个词为动词，则分割第一小段，经过分割后，各个小段都成为名词短语，以每个小段为名建立本体，并根据常见语法结构及其对应语义关系中的策略建立本体之间的联系；

3.3对各个小段，如果词的个数大于1，查询最后的名词，分割短语，以各段为名建立本体，按照常见语法结构及其对应语义关系中的策略建立本体之间的联系；

3.4判断是否存在单词个数大于1的名词短语，若有则返回步骤3.3)；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西安交通大学，未经西安交通大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200810232198.0/2.html，转载请声明来源钻瓜专利网。

上一篇：用于治疗和预防疾病的组合物和方法
下一篇：一种采集、回收痕量DNA的试剂及试剂盒和应用方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于本体学习的Web服务语义提取方法无效

专利文献下载