[发明专利]一种基于功能语义关联计算的Mashup服务特征表示方法有效
| 申请号: | 202010127362.2 | 申请日: | 2020-02-28 |
| 公开(公告)号: | CN111475608B | 公开(公告)日: | 2022-06-17 |
| 发明(设计)人: | 陆佳炜;吴涵;马超治;张元鸣;高飞;肖刚 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/289;G06F40/30;G06F40/247;G06K9/62 |
| 代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
| 地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 功能 语义 关联 计算 mashup 服务 特征 表示 方法 | ||
一种基于功能语义关联计算的Mashup服务特征表示方法,所述方法包括以下步骤:第一步、对所有需要特征表示的Mashup服务数据进行预处理;第二步、基于预处理后的Mashup服务数据,进行功能名词提取操作;第三步、对于每条Mashup服务的功能名词集合FS,对每个功能名词的语义权重进行语义关联计算;第四步、基于第三步的语义权重计算结果,结合TF‑IDF算法与Word2Vec模型,进行Mashup语义特征向量的表示。本发明能够有效提升Mashup服务的匹配精度,以及服务搜索效率。
技术领域
本发明涉及Mashup服务聚类领域,具体涉及一种基于功能语义关联计算的Mashup服务特征表示方法。
背景技术
近年来,随着大数据、云计算、移动互联网等信息技术的不断发展,Web服务所面临的业务场景也更加多样复杂,传统的单功能服务已经无法满足现实中灵活多变的用户需求。在这种背景下,Mashup技术被认为是解决该问题的一个关键途径。Mashup技术通过混搭多种不同功能的Web API服务,从而构建出一种全新的Web应用—Mashup服务。这一便捷高效的开发技术极大的提升了软件开发人员对于组合级应用的开发效率,它允许软件开发人员从类似ProgrammableWeb这样的公共服务仓库中,挑选出若干合适的Web API进行Mashup服务构建。因此,对于软件开发人员而言,如何挑选出最具参考价值的Mashup服务成为需要解决的重点问题。然而,主流的服务仓库中注册有数量庞大的Mashup服务,并且大多数的Mashup服务仅采用自然语言的方式对服务进行描述,缺乏规范性的Web服务描述语言(WSDL)文档,这无疑给服务搜索工作增加了极大的难度。
为了能让计算机精准定位满足用户需求的Mashup服务,国内外不少研究学者都将研究的重点聚焦于Mashup服务描述,利用TF-IDF、LDA、Word2Vec等模型来对服务描述文本进行功能特征表示,以此提升服务识别精度,加快服务搜索的效率。例如,Gao等人就利用TF-IDF技术将Mashup服务描述文本表示成TF-IDF向量,并在此基础上对Mashup服务进行聚类、推荐等工作。Shi等人通过结合Word2Vec和LDA,设计出一种增强LDA模型,用于生成高质量的词向量模型,进而提升Mashup服务的匹配精度。Cao等人利用Mashup服务的名称、描述、标签、类别、Web API等属性构建出一种新颖的Mashup网络模型,并结合LDA技术将该网络模型整合到Mashup服务主题模型的计算过程中,有效的提升了Mashup服务的匹配精度及聚类性能。
发明内容
为了能够有效提升Mashup服务的匹配精度,以及服务搜索效率。本发明提出了一种基于功能语义关联计算的Mashup服务特征表示方法。该方法首先对每条Mahsup服务描述文本进行了规范化处理,并根据Web API组合的标签对相应Mashup服务标签进行扩充。在此基础上,利用服务标签以及服务描述中的功能名词信息,进行功能语义关联计算,并将其计算结果作为语义制约因子嵌入TF-IDF权重公式,使权重计算敏感于文档的语义关联变化。最后,将权重计算结果与Word2Vec词向量相结合,构造出Mashup语义特征向量,使其更能反映服务真实的功能特征。
为了解决上述技术问题本发明所采用的技术方案是:
一种基于功能语义关联计算的Mashup服务特征表示方法,包括以下步骤:
第一步、对所有需要特征表示的Mashup服务数据进行预处理,过程如下:
步骤(1.1)遍历每条Mashup服务信息,针对性的提取出服务名称、服务描述、WebAPI组合信息、类别信息以及标签信息进行整理,进行步骤(1.2);
步骤(1.2)如果遇到缺失服务描述或描述内容过于简短的情况,则直接将该服务剔除,进行步骤(1.3);
步骤(1.3)如果遇到缺失服务名称的情况,则将设置特定的递增序列号作为默认的服务名称,进行步骤(1.4);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010127362.2/2.html,转载请声明来源钻瓜专利网。





