[发明专利]一种基于开发者实践技能相似性的同行推荐方法有效

专利信息
申请号: 201310538491.0 申请日: 2013-11-04
公开(公告)号: CN103530428A 公开(公告)日: 2014-01-22
发明(设计)人: 李兵;何鹏;杨习辉;汪文娟 申请(专利权)人: 武汉大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人: 张火春
地址: 430072 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 开发者 实践 技能 相似性 同行 推荐 方法
【权利要求书】:

1.一种基于开发者实践技能相似性的同行推荐方法,其特征在于,包括以下步骤:

步骤1:计算开发者间的实践技能相似性,其具体实现包括以下子步骤,

步骤1.1:根据获得的社区数据,从中提取用于表示开发者实践技能的各种属性信息,将开发者实践技能Expertise表示为由开发者在项目中担任的角色ATp、项目的状态ATs、项目的主题ATt、项目的开发语言ATlan、项目的目标受众ATia和项目的认证ATlic六个属性构成的向量,即Expertise=(ATp,ATs,ATt,ATlan,ATia,ATlic),其中每一个属性又表示为ATi=(wi1,wi2,wi3,...,win),n为每个属性中所涉及的元素个数,wij为第i个属性的第j个元素的权值;

步骤1.2:采用文本挖掘方法中的TF-IDF公式,经对数变换处理得到一个开发者d在第i个属性的元素j上的权重wdij与属性向量|AT|标准化的表达式为:

wdij=(logfdij+1)log#devs#devj]]>

|AT|=1Σjdi((logfdij+1)·log#devs#devj)2]]>

对于开发者d,如果第i个属性的第j个元素在他参与的项目中出现的次数fdij越多,且参与含有属性元素j的项目开发的开发者数#devj与总开发者数#devs的比值越小,则这个开发者在该属性元素上的实践技能越高;

步骤1.3:采用余弦相似性计算两个开发者A和B的实践技能相似性Sim(A,B),则开发者A和B在第i个属性上的实践技能相似性为:

cos(AATi,BATi)=ΣjATiBTi(logfAij+1)(logfBij+1)(log#devs#devj)2ΣjATi((logfAij+1)·log#devs#devj)2·ΣjBTi((logfBij+1)·log#devs#devj)2]]>

因此,两个开发者A和B的实践技能相似性Sim(A,B)为:

Sim(A,B)=Σi=1nαicos(AATi,BATi),n=6]]>

其中,αi依次为六个属性对应的比重系数,且αi满足∑αi=1,(i=1,2,...6);

步骤2:计算开发者间共同开发者数,其具体实现包括以下子步骤,

步骤2.1:根据开发者与项目的隶属关系,构建开发者-项目二分网络BDEV_Net=(Nd,Np,Edp),Nd表示开发者的节点集,Np表示项目的节点集,Edp为开发者与项目之间的隶属关系集;

步骤2.2:根据上述的BDEV_Net网络投影得到开发者合作网络DEV_Net=(Nd,Ed),即如果两个开发者参与了同一个项目的开发,则视为他们之间存在一条合作连边,Nd表示开发者的节点集,Ed为开发者合作连边集;

步骤2.3:基于开发者合作网络DEV_Net,网络中最短路径为2的两个开发者A,B之间存在共同的合作同行,路径条数便为开发者间共同开发者数CDAB

步骤2.4:为标准化开发者间共同开发者数的影响,采用平方根函数处理CDAB,得到标准化后的两个开发者A和B的共同开发者数:

F(CDAB)=1-1CDAB+1;]]>

步骤3:开发者潜在合作同行推荐,其具体实现包括以下子步骤,

步骤3.1:给定任意一个开发者,结合该开发者与其他开发者的实践技能相似性与共同开发者数,计算开发者之间的得分Score(A,B):

Score(A,B)=(1-Eab)(βSim(A,B)+(1-β)F(CDAB))=(1-Eab)(βΣi=1nαicos(AATi,BATi)+(1-β)(1-1CDAB+1))]]>

其中,β用来权衡实践技能相似性与共同开发者数的影响比重,β满足0≤β≤1;在开发者合作网络DEV_Net的Ed集中,若开发者A,B有合作,则Eab=1,否则为Eab=0;

步骤3.2:根据开发者间的得分情况,对潜在的合作同行按照得分降序排列,最后为开发者返回前10个最可能建立合作的同行;

步骤3.3:将推荐的结果与之后一年内开发者的实际合作情况进行对比,推荐的十个同行中,开发者只要与其中的任何一个建立了合作,则推荐成功,然后采用平均排序倒数MRR和平均准确率MAP进行评价推荐效果。

2.根据权利要求1所述基于开发者实践技能相似性的同行推荐方法,其特征在于:步骤3.1所述的β用来权衡实践技能相似性与共同开发者数的影响比重,其具体实现包括以下子步骤:

步骤3.1.1:首先,设定属性的比重系数分布如下:

(1)比重系数平均分配,即α123456=16;

(2)比重系数非平均分配,设定主题的属性系数α3=0.4,其他5个属性的系数α12456=0.12;

(3)比重系数独立分配,设αi=1,αk≠i=0,即每次只考虑一个属性与共同开发者数的作用;

步骤3.1.2:对比三种情况下,β在[0,1]变化时推荐成功的开发者数与平均排序倒数MRR,平均准确率MAP精度;

步骤3.1.3:根据步骤C1.2得知项目主题比重系数α3与目标受众比重系数α5在β=0.2或0.3时,推荐效果最好,进一步分析当β=0.2或0.3时,两者比重系数在满足α35=1的何种情况能使推荐效果最佳。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310538491.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top