[发明专利]一种软件缺陷预测方法在审
| 申请号: | 202110896447.1 | 申请日: | 2021-08-05 |
| 公开(公告)号: | CN113656294A | 公开(公告)日: | 2021-11-16 |
| 发明(设计)人: | 孟倩 | 申请(专利权)人: | 江苏师范大学 |
| 主分类号: | G06F11/36 | 分类号: | G06F11/36;G06N3/00;G06N20/10 |
| 代理公司: | 北京淮海知识产权代理事务所(普通合伙) 32205 | 代理人: | 周淑淑 |
| 地址: | 221116 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 软件 缺陷 预测 方法 | ||
1.一种软件缺陷预测方法,其特征在于,包括以下步骤:
步骤1:数据预处理
步骤1-1:软件缺陷样本数据采集;
步骤1-2:对采集到的样本数据进行清理,形成信息决策表S∈U,CRS∪D,其中,U为论域,表示全体样本,CRS为条件属性集,D为决策属性集;
步骤1-3:采用等频率间隔划分方法对信息决策表SU,CRS∪D进行离散化处理;
步骤1-4:采用粗糙集约简的算法对全体样本U进行属性约简得到样本集;
步骤2:对属性约简后的样本集进行归一化,并将样本集划分为训练样本集和测试样本集两部分;
步骤3:利用基于粒距动态改变惯性权重ω的改进粒子群算法搜索支持向量机模型的最优参数组合(C,σ),其中C为支持向量机的惩罚因子,σ为支持向量机的核参数;
步骤4:基于最优参数组合(C,σ)重新建立并训练支持向量机模型;
步骤5:对测试样本进行预测。
2.根据权利要求1所述的一种软件缺陷预测方法,其特征在于,所述步骤1-2中,对样本数据进行清理具体如下:对不平衡数据和脏数据预处理,删除全体样本中的“重复数据”和“矛盾数据”,信息决策表SU,CRS∪D是由随机提取的50%的有缺陷样本和50%的无缺陷样本组成。
3.根据权利要求1或2所述的一种软件缺陷预测方法,其特征在于,所述步骤1-3中等频率间隔划分方法具体是:将所有M个属性值按照顺序排列,然后划分成K个区间段,每个区间段包含属性的个数为M/K个。
4.根据权利要求1或2所述的一种软件缺陷预测方法,其特征在于,所述步骤1-4中,采用粗糙集约简的算法对全体样本U进行属性约简具体如下:
由式I(B,D)=H(D)-H(D|B),I(αPSO,D|B)=H(D|B)-H(D|B∪{αPSO})求得然后令B=B∪{β},重复直到I(B,D)=I(CRS,D),此时B就是所求信息决策表SU,CRS∪D的一个约简;
式中:B为初始值是信息决策表SU,CRS∪D中CRS关于D的核;
αPSO∈CRS\B,H(Q|P)为知识Q相对于知识P的条件熵;
αPSO为CRS\B的子集。
5.根据权利要求4所述的一种软件缺陷预测方法,其特征在于,所述步骤2中对样本集进行归一化,利用公式(1)归一化到[-1,1]区间:
x′=(xi-xmin)/(xmax-xmin) (1)
式中:x′是归一化后的数据;
xi是原始数据的输入特征;
xmax和xmin分别是原始数据输入特征的最大值和最小值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏师范大学,未经江苏师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110896447.1/1.html,转载请声明来源钻瓜专利网。





