[发明专利]一种基于本体学习的Web服务语义提取方法无效
申请号: | 200810232198.0 | 申请日: | 2008-11-07 |
公开(公告)号: | CN101398858A | 公开(公告)日: | 2009-04-01 |
发明(设计)人: | 齐勇;王坚;沈林峰;罗元盛;徐东红 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/08 |
代理公司: | 西安通大专利代理有限责任公司 | 代理人: | 张震国 |
地址: | 710049*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 本体 学习 web 服务 语义 提取 方法 | ||
1.基于本体学习的Web服务语义提取方法,其特征在于:
1)读取需要解析的WSDL文件,建立类型集合并初始化一个空本体集合用于暂存从该WSDL文件中获取的本体,进入步骤2);
2)从类型集合中取出一个未处理标签,查找本体集合中是否存在与当前要处理的标签同名的本体,如果存在则进入步骤4),否则以该标签作为本体的名字构造一个新的本体对象并将其加入本体集合,进入步骤3);
3)首先分析该标签的语法结构,根据其对应的语义关系建立相应的本体以及本体之间的关系,并将新建立的本体加入本体集合;然后在类型集合中查找该标签对应的文档节点,分析其文档结构,如果存在子元素则对子元素标签进行步骤2)处理,之后根据文档结构对应的语义关系建立本体之间的关系;
4)如果类型集合中还存在未处理类型,取该类型的标签进入步骤2),否则依次取本体集合中的本体进入步骤5);
5)从本体集合中取一个未存储本体,在本体库中查找是否存在与该本体同名的本体,如果存在则合并这两个本体,进入步骤7);否则将此本体存入本体库,进入步骤6);
6)取出与该本体具有相同祖先或者与该本体包含有相同本体的本体,依次取出这些本体与该本体进行比较,根据比较结果建立这些本体的关系,进入步骤7);
7)如果本体集合中还存在未存储本体,进入步骤5),否则进入步骤8);
8)解析WSDL文件中的服务相关信息,根据操作输入输出对应的类型参数为服务添加语义信息。
2.根据权利要求1所述的基于本体学习的Web服务语义提取方法,其特征在于:所说的步骤3)具体过程如下:
3.1预处理:将标签进行分词处理,得到一个有序的英文单词词组,然后再查找其中每个单词词性;
3.2如果存在介词,则根据介词的位置将本体分割成小段,如果标签第一个词为动词,则分割第一小段,经过分割后,各个小段都成为名词短语,以每个小段的名词短语为名建立本体,并根据常见语法结构及其对应语义关系中的策略建立本体之间的联系;
3.3对各个小段,如果词的个数大于1,查询最后的名词,分割短语,以各段的名词短语为名建立本体,按照常见语法结构及其对应语义关系中的策略建立本体之间的联系;
3.4判断是否存在单词个数大于1的名词短语,若有则返回步骤3.3);
3.5根据标签的名字在类型集合中查找相应文档元素,判断这个元素的类型是element、simpleType还是complexType,若不存在则结束对该标签的语义分析,element、simpleType和complexType都是XML Schema中的元素类型;
3.6如果是element类型,看其中是否有type属性即看其类型是否在类型集合中存在,如果存在则取type属性对应的标签为当前标签,进入步骤2)并将此本体与类型名对应的本体建立等价关系,然后看是否有子元素;如果没有type属性,则直接看是否有子元素,如果有子元素则进入步骤2),并使用相应的策略建立语义关系,否则结束对该标签的语义分析;
3.7如果是simpleType类型,取其标签为当前处理标签,进入步骤2),然后看其是使用哪种形式构建,根据常见文档结构及其对应语义关系中的策略建立语义关系,之后结束对该标签的语义分析;
3.8如果是complexType类型,取其标签为当前处理标签,进入步骤2)然后取其子元素,看构建方式是扩展还是自定义,如果是扩展,取base属性对应的标签为当前标签,进入步骤2),然后根据常见文档结构及其对应语义关系中的策略建立两者的包含关系;如果是自定义,看其是否有name属性,如果有,取name属性对应的标签为当前标签,进入步骤2,并根据常见文档结构及其对应语义关系策略建立语义关系;否则查看是否有子元素,如果有子元素,继续取子元素进行分析,如果没有仍未分析过的子元素,结束对该标签的语义分析。
3.根据权利要求1所述的基于本体学习的Web服务语义提取方法,其特征在于:所说的步骤5)在本体库中查找是否存在与该本体同名的本体,如果存在则合并这两个本体,在合并的过程中比较当前的本体与其他本体之间的关系与数据库中先前存储的关系,若有新的关系则在数据库中插入新数据,若没有新关系,则看是否比较完所有关系,若没有比较完所有关系则返回取一个未比较的关系继续进行比较,若比较完所有关系,则进行第7)步骤,看是否有未存储的关系,如果有则存入数据库,处理完后该本体存储过程结束,到步骤7);如果不存在同名的本体,则将此本体存入本体库,进入步骤6)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810232198.0/1.html,转载请声明来源钻瓜专利网。