[发明专利]一种基于深度学习的软件众包任务推荐方法在审
申请号: | 202111579889.X | 申请日: | 2021-12-22 |
公开(公告)号: | CN114282104A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 李尤慧子;袁宇宸;殷昱煜;周丽;李玉;梁婷婷 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/35;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 周雷雷 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 软件 任务 推荐 方法 | ||
本发明公开了一种基于深度学习的软件众包任务推荐方法。目前已有很多相关研究提出使用深度学习的方法对众包任务文本信息来进行众包任务推荐,但在现有的方法中,众包任务文本信息的提取方法缺乏通用性,且由于众包数据分布不平衡的特点,在推荐结果的指标上,命中率与多样性无法兼顾。本发明方法包含三部分的内容:基于预训练模型Bert提取众包文本特征、基于CNN+LSTM对众包文本特征进行进一步的特征学习和基于上述两个模型作用下的输出,能够自适应克服众包数据分布不平衡的损失函数。通过本发明可以在简单高效地针对特定软件众包平台实现开发者的推荐,同时也提高了推荐结果的命中率与多样性。
技术领域
本发明属于众包领域,涉及一种针对多类型软件众包任务的自适应推荐方法。
背景技术
近年来,随着软件复杂性的增加,将一个大的软件开发任务分成几个小的任务是一种常规方法。分离步骤可能包括:(1)将一个大型项目划分为一系列小模块,这些模块具有简单的需求、清晰的接口、明确的目标和全面的测试;(2)将所有这些模块组合成最终的工件。这一趋势为众包软件开发的出现奠定了坚实的基础。
与传统的外包相比,众包强调的是以自由自愿的形式外包给非特定的大众志愿者的做法,他们被分配到特定项目的小部分。近年来,市场繁荣,出现了许多众包平台,如国内的码市、程序员客栈,国外的TopCoder等。
在典型的软件众包过程中,首先,请求者将软件开发任务发布到平台上。任何开发人员都可以根据其个人兴趣和熟练程度注册为该特定开发任务的“注册人”。这一过程可能会持续一段时间。接着,如果所需的需求、规格等都清楚,“注册人”再被请求者或平台确认后就可开始工作。最后,在截止日期之前,开发人员应在完成其开发工作后将其最终作品上载到平台,然后等待审阅者或请求者根据几个评价指标确定采纳一个或几个注册者的作品。
然而,请求者不得不浪费大量时间等待足够的开发人员注册并从他们中间挑选合适的开发人员。即使如此,被选定的开发人员也可能不是特定任务的最合适开发人员,因为“合适的开发人员”可能会因为大量可用任务而错过此任务。当大量开发人员对发布的任务进行注册时,注册者过滤的效率将更差,最终任务作品的质量将更不稳定。因此,为软件众包平台中的任务推荐目标开发人员是非常重要的。但考虑到软件众包平台的特殊性,传统的基于内容的推荐无法获得良好的效果,原因有很多:首先,软件众包历史任务数据集满足二八定律,且极度不平衡。其次,软件众包潜在开发人员数量太大,传统的方法无法有效学习。上述原因会使得“活跃”开发者更容易被推荐,而相对“不活跃”的开发者则容易被“雪藏”,这显然违背了众包的初衷。
目前的研究中已提出很多推荐方案设计,这些方案主要通过提取相关的文本特征进行适当的推荐,它通常分为基于众包任务的文本特征和基于众包任务与开发者的混合文本特征;基于众包任务文本的特征,往往强依赖于一些关键字或针对某个任务类型进行优化,缺乏一定的通用性;基于任务文本与开发者的混合文本特征加入了有关开发者信息,但目前大部分软件众包平台除了在任务完成后提供满意度评分外,并没有为请求者提供更进一步的反馈内容,只能利用开发人员自己定义的文本信息进行建模,但这种信息并不总是可信的。同时大部分方法往往在模型训练过程中只考虑单个开发者,而在实际应用中往往一个软件众包任务需要多个开发者协同完成或有多个候选开发人员,且只使用单个开发者进行训练并不能很好地实现推荐结果的多样性。之所以考虑多样性,其目的是鼓励更多的开发者迁移到任务中,因为众包的本质是利用“群体智慧”。如果专注于优化命中率,那么推荐系统在统计上是准确的,但是如果它的多样性较差,那么它在实际应用中可能不是很有用。
发明内容
本发明的目的在于为进一步提升软件众包推荐方法在推荐命中率与多样性的能力,且具有一定的泛用性,而提出一种基于深度学习的软件众包任务推荐方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111579889.X/2.html,转载请声明来源钻瓜专利网。