[发明专利]一种基于主题和服务组合信息的web服务推荐方法有效
申请号: | 201810424947.3 | 申请日: | 2018-05-07 |
公开(公告)号: | CN108629010B | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 王勇;胡昊 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李玉平 |
地址: | 210046 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主题 服务 组合 信息 web 推荐 方法 | ||
1.一种基于主题和服务组合信息的web服务推荐方法,其特征在于,包括步骤如下:
步骤1,获取用户对于web服务的历史偏好记录以及web服务的标签,描述,服务组合信息;
步骤2,利用LDA模型训练得出服务-主题矩阵,根据服务-主题矩阵,计算web服务之间的主题相似度;
步骤3,根据web服务之间的服务组合信息,计算web服务的服务组合相似度;
步骤4,结合主题相似度和服务组合相似度,计算每个web服务的邻居服务集合;
步骤5,结合主题相似度和服务组合相似度,以及步骤4中的邻居服务集合,利用SVD矩阵分解模型,预测用户对于每个web服务的评分;
步骤6,根据用户对web服务的评分,选出评分最高的若干个web服务,推荐给用户。
2.如权利要求1所述的基于主题和服务组合信息的web服务推荐方法,其特征在于,步骤2中,LDA主题模型的输入是每个web服务的文本预处理后的描述文档,输出是每个web服务的服务-主题分布以及主题-词频分布,采用余弦相似度计算web服务之间的主题相似度,计算公式为:
其中,表示第i个web服务和第j个web服务,是第i个服务的主题分布向量,是第j个服务的主题分布向量,表示向量的内积,为向量的模。
3.如权利要求1所述的基于主题和服务组合信息的web服务推荐方法,其特征在于,步骤3中,计算服务组合相似度的具体流程是:提取web服务的服务组合信息,具体为M={api1,api2…},M表示mashup服务,api1,api2…是该mashup服务调用的原子服务,建立服务-API调用关系矩阵,判断web服务是原子服务还是mashup服务,如果两个web服务是两个原子服务,则根据调用关系矩阵,计算公式如下:
其中,,表示第i个web服务和第j个web服务,Mi表示调用第i个web服务的mashup服务集合,Mj表示调用第j个web服务的mashup服务集合;
如果两个web服务是两个mashup服务或者一个mashup服务一个原子服务,则根据调用关系矩阵,计算公式如下:
其中,Ai表示第i个web服务所调用的原子服务集合,Aj表示第j个web服务所调用的原子服务集合。
4.如权利要求1所述的基于主题和服务组合信息的web服务推荐方法,其特征在于,选择邻居的时候,分别会选择在主题上以及服务组合上最近的k个邻居,选取的原则是根据web服务的相似度大小,相似度越大则越相近:
使用以下约束目标来选择web服务的WSi邻居集合:
其中表示与第i个web服务相似度最大的k个服务的集合。
5.如权利要求1所述的基于主题和服务组合信息的web服务推荐方法,其特征在于,步骤5中,使用SVD矩阵分解的方法进行评分预测,其中,预测模型如下:
其中表示用户u对服务s的评分,表示全局平均偏差,表示用户偏差,表示服务偏差,为用户端隐式向量,为服务端隐式向量,为权重系数,为两个服务s和l之间的主题相似度和服务组合相似度;为服务s在主题层面上的邻居集合;为服务s在服务组合层面上的邻居集合;
通过最小化损失函数,利用随机梯度下降的方法,求解该预测模型,损失函数L如下:
其中,M表示用户历史评分信息集合,表示用户u对服务s的评分属于集合M,是用户的实际评分值,损失函数中加入正则项防止过拟合,λ为正则项系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810424947.3/1.html,转载请声明来源钻瓜专利网。