[发明专利]一种跨项目软件缺陷预测方法及系统在审
| 申请号: | 202210928904.5 | 申请日: | 2022-08-03 | 
| 公开(公告)号: | CN115168237A | 公开(公告)日: | 2022-10-11 | 
| 发明(设计)人: | 李志强;牛靖雯 | 申请(专利权)人: | 陕西师范大学 | 
| 主分类号: | G06F11/36 | 分类号: | G06F11/36;G06K9/62;G06Q10/04 | 
| 代理公司: | 西安铭泽知识产权代理事务所(普通合伙) 61223 | 代理人: | 梁静 | 
| 地址: | 710119 陕西*** | 国省代码: | 陕西;61 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 项目 软件 缺陷 预测 方法 系统 | ||
1.一种跨项目软件缺陷预测方法,其特征在于,包括以下步骤:
对待测软件的目标项目数据以及多个不同的候选的其他软件的源项目数据分别进行归一化处理;
利用最大均值差异法,分别测量目标项目数据与每个源项目数据之间的数据分布的相似性;
根据目标项目数据与每个源项目数据之间的数据分布的相似性,选择与目标项目数据分布相似的源项目数据;
利用分类器算法,并根据所选择的源项目数据,构建跨项目缺陷预测模型;
根据所构建的跨项目缺陷预测模型对待测软件的目标项目数据进行预测,判断目标项目数据是否存在缺陷。
2.根据权利要求1所述的一种跨项目软件缺陷预测方法,其特征在于:所述目标项目数据为待测的软件项目的实际运行数据;
所述源项目数据为其他软件项目的历史缺陷数据;
所述实际运行数据及历史缺陷数据均为软件实体数据,所述软件实体数据为从软件程序代码中抽取的实例模块。
3.根据权利要求2所述的一种跨项目软件缺陷预测方法,其特征在于:所述归一化处理的方法为z-score法,其计算方法如下:
其中,xi是软件实体x的第i个度量元的原始值,μx是软件实体x的平均值,σx是软件实体x的标准差,是xi归一化后的值。
4.根据权利要求3所述的一种跨项目软件缺陷预测方法,其特征在于:所述利用最大均值差异法,分别测量目标项目数据与每个源项目数据之间的数据分布的相似性,包括:
利用最大均值差异法分别计算目标项目数据与每个源项目数据之间的数据分布的最大均值差异值MMD,计算方法如下:
其中,为源项目数据中的第i个软件实体;
为源项目数据中的软件实体数据集;
ns为源项目数据中的软件实体数目;
为目标项目数据中的第i个软件实体;
为目标项目数据中的软件实体数据集,
nt为目标项目数据中的软件实体数目;
表示再生希尔伯特空间;
表示再生希尔伯特空间中的一个非线性映射函数。
5.根据权利要求4所述的一种跨项目软件缺陷预测方法,其特征在于:当所述目标项目数据与某一个源项目数据之间的最大均值差异值越小,则目标项目数据与源项目数据之间的数据分布的相似性越高,该源项目数据与目标项目数据分布相似。
6.根据权利要求5所述的一种跨项目软件缺陷预测方法,其特征在于:所述根据目标项目数据与每个源项目数据之间的数据分布的相似性,选择与目标项目数据分布相似的源项目数据,包括:
将计算得到的所述目标项目数据与各个源项目数据之间的最大均值差异值MMD进行从小到大排序;
利用黄金分割法将前k个最大均值差异值MMD所对应的源项目数据分别作为与目标项目数据分布相似的源项目数据。
7.根据权利要求6所述的一种跨项目软件缺陷预测方法,其特征在于:所述利用分类器算法,并利用所选择的源项目数据,构建跨项目缺陷预测模型,包括:
根据k个与目标项目数据分布相似的所述源项目数据,分别利用分类器算法在第j个源项目数据Sj上建立模型hj,1≤j≤k,得到k个分类器模型;所述分类器算法为逻辑回归分类器;
根据k个分类器模型,并基于多源集成法构建跨项目缺陷预测模型。
8.根据权利要求7所述的一种跨项目软件缺陷预测方法,其特征在于:所述分类器算法还包括:朴素贝叶斯、最近邻、支持向量机、决策树、随机森林、神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210928904.5/1.html,转载请声明来源钻瓜专利网。





