[发明专利]基于特征和实例迁移的跨项目软件缺陷预测方法及系统在审

专利信息
申请号: 202111627584.1 申请日: 2021-12-28
公开(公告)号: CN114328221A 公开(公告)日: 2022-04-12
发明(设计)人: 李文昊;李凡平;石柱国 申请(专利权)人: 以萨技术股份有限公司
主分类号: G06F11/36 分类号: G06F11/36;G06N3/00;G06N3/12
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 朱忠范
地址: 266427 山东省青岛*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 特征 实例 迁移 项目 软件 缺陷 预测 方法 系统
【说明书】:

发明属于软件缺陷预测领域,提供了基于特征和实例迁移的跨项目软件缺陷预测方法及系统,该方法包括:特征迁移阶段采用了包裹式特征选择方法,通过候选迁移特征子集在验证集上的预测效果为依据来选择迁移特征集合,效果比起过滤特征选择方法更加稳定有效;在实例迁移阶段采用代价敏感学习方式对于数量少代价高的缺陷样本提高其在训练过程中的比重以此解决数据集的类不平衡问题,最后,使用特征迁移和实例迁移后的数据构建预测模型,以此提升单一迁移角度建模的预测性能。

技术领域

本发明属于软件缺陷预测领域,尤其涉及基于特征和实例迁移的跨项目软件缺陷预测方法及系统。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。

软件缺陷预测可分为同项目软件缺陷预测和跨项目软件缺陷预测。同项目软件缺陷预测指的是利用同一软件的历史版本信息来构建缺陷预测模型,跨项目软件缺陷预测指的是利用其他软件的历史数据信息来构建模型对目标软件进行缺陷预测。由于在实际应用中,很多新开发的软件没有足够的历史数据信息可以提供,同项目软件缺陷预测难以发挥作用,因此,跨项目软件缺陷预测成为了领域内的研究热点。迁移学习是解决跨项目软件缺陷预测的主要手段,其中包括特征迁移和实例迁移。目前的研究中还存在以下问题需要解决:

1.在基于特征迁移的跨项目软件缺陷预测研究中,大多使用过滤式特征选择方法即利用统计学方法计算特征在不同项目上的分布相似性进而选出合适的迁移特征,但是该方法衡量迁移特征质量的角度单一,无法保证特征迁移的效果。

2.在基于实例迁移的跨项目软件缺陷预测研究中,很少有研究解决缺陷数据集的类不平衡性问题,该问题会影响模型的训练过程,导致模型预测结果偏向数目较多的无缺陷类,降低对缺陷模块预测的准确性。

3.在跨项目软件缺陷预测研究中,很少有研究从特征和实例两个角度上进行迁移学习,无法进一步提升缺陷预测的效果。

发明内容

为了解决上述背景技术中存在的至少一项技术问题,本发明提供一种基于特征迁移和实例迁移的跨项目软件缺陷预测方法,在特征迁移阶段采用了包裹式特征选择方法,通过候选迁移特征子集在验证集上的预测效果为依据来选择迁移特征集合,效果比起过滤特征选择方法更加稳定有效;在实例迁移阶段采用代价敏感学习方式对于数量少代价高的缺陷样本提高其在训练过程中的比重以此解决数据集的类不平衡问题,最后,使用特征迁移和实例迁移后的数据构建预测模型,以此提升单一迁移角度建模的预测性能。

为了实现上述目的,本发明采用如下技术方案:

本发明的第一个方面提供基于特征和实例迁移的跨项目软件缺陷预测方法,包括如下步骤:

获取软件中的操作数和操作对象的度量信息;

根据软件中的度量信息构建出源项目和目标项目的软件模块度量元;

根据源项目和目标项目的软件模块度量元和采用机器学习构建的软件缺陷预测模型,预测含有缺陷的软件模块;其中,所述采用机器学习构建的软件缺陷预测模型的过程为:从特征和实例两个角度上进行迁移学习,采用特征迁移方法对目标项目从源项目上进行特征迁移,得到用来预测软件缺陷的特征,采用实例迁移方法对目标项目从源项目上进行实例迁移,增加训练过程中预测错误代价高的缺陷样本的权重,结合特征迁移和实例迁移,基于源项目找到目标项目中概率最大的含有缺陷的软件模块。

本发明的第二个方面提供基于特征和实例迁移的跨项目软件缺陷预测系统,包括:

软件模块度量元构建模块,被配置为:

获取软件中的操作数和操作对象的度量信息;

根据软件中的度量信息构建出源项目和目标项目的软件模块度量元;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于以萨技术股份有限公司,未经以萨技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111627584.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top