[发明专利]一种基于社交网络平台的Web服务推荐方法有效
申请号: | 201310695891.2 | 申请日: | 2013-12-17 |
公开(公告)号: | CN103678618B | 公开(公告)日: | 2017-01-25 |
发明(设计)人: | 许蕾;宫敏;李言辉;陈林;徐宝文 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京天翼专利代理有限责任公司32112 | 代理人: | 黄明哲 |
地址: | 210023 江苏省南京市栖霞*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于社交网络平台的Web服务推荐方法,将Web服务分成不同的服务类,在社交网络中获取用户的基本信息,取一部分用户作为训练用户,得到用户感兴趣的服务类,并据此建立用户‑服务类矩阵,然后根据用户‑服务类矩阵对用户进行聚类,得到不同的用户兴趣类,对于社交网络中需要进行Web服务推荐的新用户,根据用户兴趣类进行推荐。本发明首先对Web服务进行主题提取,通过将Web服务映射为Web服务类,实现对用户‑服务矩阵进行降维,然后通过从社交网络中提取用户的基本信息和兴趣标签,充分利用标签信息和语义信息来解决词语同义问题,再结合通过分析已有用户的历史访问记录得到的聚类结果,对新用户进行Web服务推荐。 | ||
搜索关键词: | 一种 基于 社交 网络 平台 web 服务 推荐 方法 | ||
【主权项】:
一种基于社交网络平台的Web服务推荐方法,其特征是:根据Web服务提供商提供的服务基本信息,将Web服务分成不同的服务类,由服务类中各Web服务名称的汇总得到服务类名称;在社交网络中获取用户的基本信息,取一部分用户作为训练用户,并得到训练用户对Web服务的访问记录,提取用户对Web服务的综合评价信息生成用户‑服务矩阵,由用户‑服务矩阵中综合评价信息超过设定阈值的Web服务得到用户感兴趣的Web服务集合,对应前述服务类再对用户感兴趣的Web服务集合进行分类,得到用户感兴趣的服务类,并据此建立用户‑服务类矩阵,实现从服务到服务类的降维;然后根据用户‑服务类矩阵对用户进行聚类,得到不同的用户兴趣类,每个用户兴趣类包含四个变量:主变量是该类别对应的若干训练用户,即用户类,变量二是由根据主变量基本信息所得到的该用户类中用户的特征,变量三是该类别中用户感兴趣的服务类,变量四是变量三中用户感兴趣的服务类包含的所有服务;对于社交网络中需要进行Web服务推荐的新用户,获取新用户基本信息和兴趣标签,使用同义词词典WordNet计算新用户的兴趣标签与各服务类名称的语义相似度,得到与新用户兴趣最相似的服务类Most SC,根据用户兴趣类的变量,将服务类Most SC对应的用户兴趣类加入推荐列表,计算新用户基本信息和推荐列表中各用户兴趣类中用户特征的相似度,得到用户兴趣类排序,并对其中的服务类和服务分别排序,根据排序结果选取其中的前N个Web服务进行推荐;获取用户兴趣类具体为:11)根据Web服务提供商提供的服务基本信息,将Web服务分成不同的服务类SC;12)首先计算用户U对于服务S的所有属性的综合评价取值R(U,S),然后根据R(U,S)计算用户与服务类之间的关联系数P(U,SC):上式中,U表示用户,S表示Web服务,Set={Ratt1,Ratt2,…,Rattp}为Web服务的属性值集合,设Set1,Set2∈Set,Set1∪Set2=Set,Set1={Ratt1,Ratt2,…,Rattb}为正比集,Set2={Ratt1,Ratt2,…,Rattc}为反比集,λi和θj分别是Ratti和Rattj两项的权重参数,i=1,2,…,b,j=1,2,…,c,b和c分别为Set1和Set2的集合内元素总数,R(U,S)表示的是用户U对于服务S的所有属性的综合评价取值;其中,L表示的是服务类SC中包含的所有服务的个数,k∈[1,2,…L],Pk表示用户U访问的属于服务类SC的Web服务占其所有访问的Web服务的比例,Rk用于表示用户U对于服务类SC中第k个服务的综合评价取值,Rmax是Rk的最大值,Rmin是Rk的最小值,m和n分别是Pks和两项的系数,m取值0.5,n取值1,s是Pk的指数,t是的指数,s和t用于提高区分度,s取值2,t取值1,P(U,SC)表示用户U与服务类SC之间的关联系数;13)计算服务类与服务类之间的相似度A(SCv,SCw):SCv表示第v个服务类,SCw表示第w个服务类,N表示训练用户的总数,Uf表示第f个用户,P(Uf,SCv)即是由公式(2)得到的用户Uf与第v个服务类之间的关联系数,P(Uf,SCw)是用户Uf与第w个服务类之间的关联系数;14)根据服务类之间的相似性划分用户兴趣类:第一步,从所有服务类中选出与其他各服务类之间相似度之和Ei最大的一个服务类,作为用户兴趣类划分的起始点;第二步,以Ei递减的顺序遍历其他服务类,找出所有与所述起始点相似度大于阈值λ的服务类,λ=0.5;第三步,将第二步得到的服务类与作为起始点的服务类划分到一起,将其对应的所有用户划分成一个用户兴趣类,并已经划分的服务类从所有服务类的集合中移除;返回第一步,对剩余的服务类重复进行第一步至第三步,如此迭代,直至服务类集合为空为止;15)根据第14)步所得到的用户兴趣类以及各用户基本信息,分析归纳各用户兴趣类中的用户特征,包括性别c1、年龄c2和职业c3等;采用个性化推荐算法对社交网络中的新用户进行Web服务推荐具体为:21)由社交网站获取新用户标注的兴趣标签和基本信息,使用同义词词典WordNet, 根据公式(4)计算出新用户的兴趣标签和各服务类名称的语义相似度sim(M1,M2),M1和M2为兴趣标签和服务类名称对应的码字,M1=(x1x2x3……xd),M2=(y1y2y3……yd),d表示码字的长度,排序后从中选出与用户兴趣最相似的服务类Most_SC;其中xq,yq分别表示兴趣标签和服务类名称的码字中第q位的分量,经过对关键词的映射变为1或0,关键词采用服务类名称,兴趣标签如果与服务类名称为同义词,那么对应的码字分量就定义为1,否则定义为0;22)找出包含服务类Most_SC的用户兴趣类,加入推荐列表中;23)计算新用户基本信息和推荐列表中所有用户兴趣类中用户特征的相似度,并且从大到小排序,具体过程为:a)在推荐列表中,所有用户兴趣类对应的权重初始值都为0;b)从推荐列表起始开始遍历,当用户兴趣类的用户特征性别c1、年龄c2和职业c3分别和新用户的基本信息的对应项内容相符时,权重分别增加w1、w2、w3,如果不相符,则仍然为0;根据公式(5)计算出相似度的取值;UPAa表示用户兴趣类a用户特征信息,UPAnew表示新用户特征基本信息,w1、w2、w3表示用户兴趣类a在用户性别c1、年龄c2和职业c3三种特征上与新用户对应项的权重增加情况;c)将推荐列表中的用户兴趣类按照相似度从大到小顺序排序;24)找出排序后的推荐列表中优先级最高的前三个用户兴趣类,再选择每个兴趣类的前N个Web服务推荐给新用户,前N个服务选择方式为:选择用户兴趣类中的前e个服务类,每个服务类中取前g个服务,N=e*g,用户兴趣类中服务类的排序顺序根据公式(6)计算,每个服务类中Web服务的排序根据公式(7)计算:P(Uy,SC)为通过公式(2)得到的第y个用户的P(U,SC),Uy表示第y个用户,SC表示的是服务类,X表示服务类SC对应的用户总数,Q(SC)表示的是服务类SC质量,R(Uz,S)为通过公式(1)得到的第z个用户的R(U,S),Uz表示第z个用户,S表示的是服务,P表示服务S对应的用户总数Q(S)表示的是服务S的质量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310695891.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于搜索引擎的概念语义相似度度量方法
- 下一篇:一种数据备份方法及系统