[发明专利]一种Web服务聚类的方法有效

专利信息
申请号: 201010613232.6 申请日: 2010-12-30
公开(公告)号: CN102043863A 公开(公告)日: 2011-05-04
发明(设计)人: 吴健;马莹;王飞 申请(专利权)人: 浙江大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 杭州裕阳专利事务所(普通合伙) 33221 代理人: 江助菊
地址: 310027 浙江省杭*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 web 服务 方法
【说明书】:

技术领域

发明涉及Web服务领域,尤其是一种Web服务聚类的方法,结合Vector Space Model(VSM,向量空间模型)技术,对Web服务进行向量化处理,并通过Locality Sensitive Hashing(LSH,位置敏感哈希)进行扩展,完成对Web服务的聚类。

背景技术

随着Internet各种技术的不断发展及异构化平台之间协同工作要求的提出,Web服务作为一个优秀的解决方案,逐渐得到越来越多的重视。Web服务能够集成不同的应用,形成统一的一套解决方案,它被广泛地应用于电子商务、工作流甚至是日常生活中。单独的Web服务难以解决复杂的应用要求,因此,学术界及工业界对Web服务的关注多集中于Web服务组合、Web服务发现等方面。在这些研究领域中,Web服务聚类起到了很好的辅助作用,一个聚类结果良好的Web服务集合,可以在Web服务组合中提供具有更好的Quality of Service(Qos,Web服务质量,是网络的一种安全机制, 是用来解决网络延迟和阻塞等问题的一种技术。当网络过载或拥塞时,QoS 能确保重要业务量不受延迟或丢弃,同时保证网络的高效运行。)的组合结果;或者在Web服务发现中,返回给用户更符合要求的Web服务子集。如何对一个Web服务集合进行准确、高效的聚类,便成了Web服务技术领域中人们所关心的一个重要问题。

Web服务聚类是对Web服务进行聚合,将Web服务库中的Web服务分成多个类别,使得同一类别中的Web服务或功能相似,或输入输出相似,或有相似程度的Qos。在Web服务组合或Web服务发现之前,对Web服务进行聚类,会极大提升上述Web服务聚类的效率,但Web服务聚类本身也存在着效率问题。当前对于Web服务聚类的技术,多与Web服务组合或Web服务发现结合进行,或对具体情况提出具有针对性的聚类方法,如针对用户日志及访问记录进行聚类以分析用户偏好等。这些研究采用的聚类方法,多是常见的数据挖掘中的聚类方法或是这些方法的改进,如K-means方法、DIANA方法等,这些聚类方法在特定情况下具有一定的优势,但却存在着以下不足:一是Web服务聚类不准确,这是由于其聚类方法本身的局限性所造成的,如K-means对孤立点十分敏感,少量孤立点会对聚类结果产生极大影响;二是大多聚类方法对于高维空间(即Web服务的属性较多的情况),聚类效率较低,而且由于只考虑基于某一方面的Web服务聚类,如只针对Web服务的功能属性进行聚类,虽适用于Web服务组合,但舍弃了Qos的考虑,使得应用这种聚类结果进行的Web服务发现难以快速找到Qos水平较高的Web服务,因此不具有普适性。  

发明内容

本发明的目的在于:提供一种Web服务聚类的方法,能够在动态变化的Web服务库中高效、准确地进行Web服务聚类,并具有普适性。

为实现上述目的,本发明可采取下述技术方案:

本发明一种Web服务聚类的方法,包括

Web服务库:为存储WDSL文档的数据库,用于给现有Web建立索引,支持数据存取和写入;

主控装置:它包括用户交互装置——为与用户IO交互的各种驱动;计算处理装置——包括内存,外存,CPU;用于获取Web服务的向量模型、运算聚类结果;数据库交互装置——包括数据库驱动及xml解析器,用户终端,输入输出设备及显示器,用于数据库通信、及用户对于某些场景或参数的选择;

标签库:用于存储以序号表示的不同的权重组合、类别标签、及以索引形式存储的Web服务库中的Web服务,并存储相应的哈希值,支持数据读出及写入;

该方法包括以下步骤:

步骤一:使用VSM方法将Web服务转化为向量集合

a.主控装置从Web服务库中读取当前所有Web服务的WDSL文档数据,若用户给定限制条件,则获取符合条件的Web服务;

     b.主控装置获取Web服务后,使用VSM方法将Web服务集合转化为向量空间集合;

所述VSM方法,是将每个所述WSDL文档中的“Web服务基本信息的描述”、“功能操作”、“输入参数”、“输出参数”以及“Qos”分割成一组关键词,表示为< Des, Oper, Input, Output, Qos >五个属性,每一个关键词代表一个维度,统计关键词在文档中的出现频率,并计算每一维向量在每个文档下的权重,进而将代表Web服务的WSDL文档转化为向量;

每一维向量在每个文档下的权重为:

    

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010613232.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top