[发明专利]一种基于主题和服务组合信息的web服务推荐方法有效

申请号：	201810424947.3	申请日：	2018-05-07
公开（公告）号：	CN108629010B	公开（公告）日：	2022-03-18
发明（设计）人：	王勇;胡昊	申请（专利权）人：	南京大学
主分类号：	G06F16/9535	分类号：	G06F16/9535;G06K9/62
代理公司：	南京苏高专利商标事务所(普通合伙) 32204	代理人：	李玉平
地址：	210046 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于主题服务组合信息 web 推荐方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于主题和服务组合信息的web服务推荐方法，其特征在于，包括步骤如下：

步骤1，获取用户对于web服务的历史偏好记录以及web服务的标签，描述，服务组合信息；

步骤2，利用LDA模型训练得出服务-主题矩阵，根据服务-主题矩阵，计算web服务之间的主题相似度；

步骤3，根据web服务之间的服务组合信息，计算web服务的服务组合相似度；

步骤4，结合主题相似度和服务组合相似度，计算每个web服务的邻居服务集合；

步骤5，结合主题相似度和服务组合相似度，以及步骤4中的邻居服务集合，利用SVD矩阵分解模型，预测用户对于每个web服务的评分；

步骤6，根据用户对web服务的评分，选出评分最高的若干个web服务，推荐给用户。

2.如权利要求1所述的基于主题和服务组合信息的web服务推荐方法，其特征在于，步骤2中，LDA主题模型的输入是每个web服务的文本预处理后的描述文档，输出是每个web服务的服务-主题分布以及主题-词频分布，采用余弦相似度计算web服务之间的主题相似度，计算公式为：

其中，表示第i个web服务和第j个web服务，是第i个服务的主题分布向量，是第j个服务的主题分布向量，表示向量的内积，为向量的模。

3.如权利要求1所述的基于主题和服务组合信息的web服务推荐方法，其特征在于，步骤3中，计算服务组合相似度的具体流程是：提取web服务的服务组合信息，具体为M={api1,api2…}，M表示mashup服务，api1，api2…是该mashup服务调用的原子服务,建立服务-API调用关系矩阵，判断web服务是原子服务还是mashup服务，如果两个web服务是两个原子服务，则根据调用关系矩阵，计算公式如下：

其中，，表示第i个web服务和第j个web服务，M_i表示调用第i个web服务的mashup服务集合，M_j表示调用第j个web服务的mashup服务集合；

如果两个web服务是两个mashup服务或者一个mashup服务一个原子服务，则根据调用关系矩阵，计算公式如下：

其中，A_i表示第i个web服务所调用的原子服务集合，A_j表示第j个web服务所调用的原子服务集合。

4.如权利要求1所述的基于主题和服务组合信息的web服务推荐方法，其特征在于，选择邻居的时候，分别会选择在主题上以及服务组合上最近的k个邻居，选取的原则是根据web服务的相似度大小，相似度越大则越相近：

使用以下约束目标来选择web服务的WS_i邻居集合：

其中表示与第i个web服务相似度最大的k个服务的集合。

5.如权利要求1所述的基于主题和服务组合信息的web服务推荐方法，其特征在于，步骤5中，使用SVD矩阵分解的方法进行评分预测，其中，预测模型如下：

其中表示用户u对服务s的评分，表示全局平均偏差，表示用户偏差，表示服务偏差，为用户端隐式向量，为服务端隐式向量，为权重系数，为两个服务s和l之间的主题相似度和服务组合相似度；为服务s在主题层面上的邻居集合；为服务s在服务组合层面上的邻居集合；

通过最小化损失函数，利用随机梯度下降的方法，求解该预测模型，损失函数L如下：

其中，M表示用户历史评分信息集合，表示用户u对服务s的评分属于集合M，是用户的实际评分值，损失函数中加入正则项防止过拟合，λ为正则项系数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载