[发明专利]一种基于采样和集成学习的软件缺陷预测方法有效
申请号: | 202110346961.8 | 申请日: | 2021-03-31 |
公开(公告)号: | CN113326182B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 徐小龙;封功业;肖甫 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06N20/10 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 田凌涛 |
地址: | 210000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 采样 集成 学习 软件 缺陷 预测 方法 | ||
1.一种基于采样和集成学习的软件缺陷预测方法,用于针对目标版本软件项目中的目标待测实例进行缺陷预测,其特征在于,包括如下步骤:
步骤A.以目标版本软件项目中已明确是否存在缺陷的各个实例作为各个样本实例,并基于各样本实例分别对应预设各类型数据的特征向量、以及各样本实例分别为有缺陷类别样本实例或无缺陷类别样本实例,构建样本数据集,然后进入步骤B;
步骤B.根据样本数据集中无缺陷类别样本实例数与有缺陷类别样本实例数的比值,作为样本数据集所对应的不平衡率值,并判断该不平衡率值是否大于1,是则进入步骤C;否则进入步骤D;
步骤C.采用SVM SMOTE采样法,针对样本数据集执行如下步骤C1至C4,实现其中有缺陷类别样本实例的扩容,获得样本数据集的更新,然后进入步骤D;
步骤C1.计算获得样本数据集归属于有缺陷类别的支持向量集合然后进入步骤C2;其中,i={1、…、|SV+|},|SV+|表示支持向量集合SV+中的实例的总个数,表示支持向量集合SV+中第i个有缺陷类别样本实例;
步骤C2.根据支持向量集合SV+,构建一维数组并针对该一维数组中的|SV+|个元素均赋值为(m--m+)/|SV+|,其中,amount(i)为一维数组Amount[|SV+|]中的第i个元素,即表示分配给支持向量集合SV+中第i个有缺陷类别样本实例所对应的新实例个数,m-表示样本数据集中无缺陷类别样本实例数,m+表示样本数据集中有缺陷类别样本实例数;
同时根据支持向量集合SV+,构建二维数组其中,j={1、…、J},J表示大于1、且不大于样本数据集中有缺陷类别样本实例数m+的预设参数值,nn(i,j)表示样本数据集中除以外其余各有缺陷类别样本实例按照与之间距离由小至大排序下的第j个有缺陷类别样本实例;
然后进入步骤C3;
步骤C3.分别针对支持向量集合SV+中的各个有缺陷类别样本实例获得样本数据集中除以外其它各样本实例按照与之间距离由小至大排序下的前2J个样本实例,构成该所对应的待分析实例集合,进而获得各分别所对应的待分析实例集合,然后进入步骤C4;
步骤C4.分别针对支持向量集合SV+中的各个有缺陷类别样本实例判断所对应待分析实例集合中无缺陷类别样本实例数是否不少于J个,是则基于nn(i,1)、…、nn(i,j)、…、nn(i,J)、nn(i,1)的循环顺序,由nn(i,1)起顺序选择amount(i)个nn(i,j),并分别根据该各个nn(i,j),按如下公式:
获得分配给所对应各个新样本实例分别对应的特征向量集合并根据该各个新样本实例均为有缺陷类别样本实例,构建获得所对应的amount(i)个新样本实例进而获得各分别所对应的amount(i)个新样本实例加入样本数据集中实现更新;否则基于nn(i,1)、…、nn(i,j)、…、nn(i,J)、nn(i,1)的循环顺序,由nn(i,1)起顺序选择amount(i)个nn(i,j),并分别根据该各个nn(i,j),按如下公式:
获得分配给所对应各个新样本实例分别对应预设各类型数据的特征向量的特征向量集合并根据该各个新样本实例均为有缺陷类别样本实例,构建获得所对应的amount(i)个新样本实例进而获得各分别所对应的amount(i)个新样本实例加入样本数据集中实现更新;
其中,表示对应预设各类型数据的特征向量的特征向量集合,Tnn(i,j)表示nn(i,j)所对应样本实例对应预设各类型数据的特征向量的特征向量集合,t表示0至1的随机数;
步骤D.应用样本数据集,以样本实例所对应预设各类型数据的特征向量为输入,样本实例分别对应有缺陷类别、无缺陷类别的概率为输出,分别针对至少两个分类器进行训练,获得各个预测模型,并应用各个预测模型分别针对目标待测实例进行处理,获得目标待测实例在各预测模型下分别对应有缺陷类别、无缺陷类别的概率,然后进入步骤E;
步骤E.针对目标待测实例在各预测模型下分别对应有缺陷类别、无缺陷类别的概率,获得目标待测实例分别对应有缺陷类别、无缺陷类别的平均概率,并据此实现目标待测实例为有缺陷类别或无缺陷类别的预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110346961.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:可降解薄膜及其制备方法
- 下一篇:内窥镜用扩展装置