[发明专利]一种Web服务聚类的方法有效
申请号: | 201010613232.6 | 申请日: | 2010-12-30 |
公开(公告)号: | CN102043863A | 公开(公告)日: | 2011-05-04 |
发明(设计)人: | 吴健;马莹;王飞 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州裕阳专利事务所(普通合伙) 33221 | 代理人: | 江助菊 |
地址: | 310027 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 web 服务 方法 | ||
技术领域
本发明涉及Web服务领域,尤其是一种Web服务聚类的方法,结合Vector Space Model(VSM,向量空间模型)技术,对Web服务进行向量化处理,并通过Locality Sensitive Hashing(LSH,位置敏感哈希)进行扩展,完成对Web服务的聚类。
背景技术
随着Internet各种技术的不断发展及异构化平台之间协同工作要求的提出,Web服务作为一个优秀的解决方案,逐渐得到越来越多的重视。Web服务能够集成不同的应用,形成统一的一套解决方案,它被广泛地应用于电子商务、工作流甚至是日常生活中。单独的Web服务难以解决复杂的应用要求,因此,学术界及工业界对Web服务的关注多集中于Web服务组合、Web服务发现等方面。在这些研究领域中,Web服务聚类起到了很好的辅助作用,一个聚类结果良好的Web服务集合,可以在Web服务组合中提供具有更好的Quality of Service(Qos,Web服务质量,是网络的一种安全机制, 是用来解决网络延迟和阻塞等问题的一种技术。当网络过载或拥塞时,QoS 能确保重要业务量不受延迟或丢弃,同时保证网络的高效运行。)的组合结果;或者在Web服务发现中,返回给用户更符合要求的Web服务子集。如何对一个Web服务集合进行准确、高效的聚类,便成了Web服务技术领域中人们所关心的一个重要问题。
Web服务聚类是对Web服务进行聚合,将Web服务库中的Web服务分成多个类别,使得同一类别中的Web服务或功能相似,或输入输出相似,或有相似程度的Qos。在Web服务组合或Web服务发现之前,对Web服务进行聚类,会极大提升上述Web服务聚类的效率,但Web服务聚类本身也存在着效率问题。当前对于Web服务聚类的技术,多与Web服务组合或Web服务发现结合进行,或对具体情况提出具有针对性的聚类方法,如针对用户日志及访问记录进行聚类以分析用户偏好等。这些研究采用的聚类方法,多是常见的数据挖掘中的聚类方法或是这些方法的改进,如K-means方法、DIANA方法等,这些聚类方法在特定情况下具有一定的优势,但却存在着以下不足:一是Web服务聚类不准确,这是由于其聚类方法本身的局限性所造成的,如K-means对孤立点十分敏感,少量孤立点会对聚类结果产生极大影响;二是大多聚类方法对于高维空间(即Web服务的属性较多的情况),聚类效率较低,而且由于只考虑基于某一方面的Web服务聚类,如只针对Web服务的功能属性进行聚类,虽适用于Web服务组合,但舍弃了Qos的考虑,使得应用这种聚类结果进行的Web服务发现难以快速找到Qos水平较高的Web服务,因此不具有普适性。
发明内容
本发明的目的在于:提供一种Web服务聚类的方法,能够在动态变化的Web服务库中高效、准确地进行Web服务聚类,并具有普适性。
为实现上述目的,本发明可采取下述技术方案:
本发明一种Web服务聚类的方法,包括
Web服务库:为存储WDSL文档的数据库,用于给现有Web建立索引,支持数据存取和写入;
主控装置:它包括用户交互装置——为与用户IO交互的各种驱动;计算处理装置——包括内存,外存,CPU;用于获取Web服务的向量模型、运算聚类结果;数据库交互装置——包括数据库驱动及xml解析器,用户终端,输入输出设备及显示器,用于数据库通信、及用户对于某些场景或参数的选择;
标签库:用于存储以序号表示的不同的权重组合、类别标签、及以索引形式存储的Web服务库中的Web服务,并存储相应的哈希值,支持数据读出及写入;
该方法包括以下步骤:
步骤一:使用VSM方法将Web服务转化为向量集合
a.主控装置从Web服务库中读取当前所有Web服务的WDSL文档数据,若用户给定限制条件,则获取符合条件的Web服务;
b.主控装置获取Web服务后,使用VSM方法将Web服务集合转化为向量空间集合;
所述VSM方法,是将每个所述WSDL文档中的“Web服务基本信息的描述”、“功能操作”、“输入参数”、“输出参数”以及“Qos”分割成一组关键词,表示为< Des, Oper, Input, Output, Qos >五个属性,每一个关键词代表一个维度,统计关键词在文档中的出现频率,并计算每一维向量在每个文档下的权重,进而将代表Web服务的WSDL文档转化为向量;
每一维向量在每个文档下的权重为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010613232.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种监控摄像机机罩清洗装置
- 下一篇:应用于中药材洗加工的装置