[发明专利]一种基于稀疏代价矩阵的软件BUG分类方法在审
申请号: | 202010538383.3 | 申请日: | 2020-06-12 |
公开(公告)号: | CN111723010A | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 李辉;杨溪;张天伦;李阳;陈荣;李博 | 申请(专利权)人: | 大连海事大学 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06F16/906;G06N3/04;G06N3/08 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 姜玉蓉;李洪福 |
地址: | 116026 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 稀疏 代价 矩阵 软件 bug 分类 方法 | ||
1.一种基于稀疏代价矩阵的软件BUG分类方法,其特征在于包括:包括以下步骤:
S1:获取软件BUG报告、对BUG报告进行分类得到类别数C;
S2:对软件BUG报告数据进行编码操作,将每条软件BUG报告处理为相同长度的向量,将软件BUG报告的类别编码为one-hot格式;
S3:初始化稀疏代价矩阵,其中矩阵规模与软件BUG类别C有关;
S4:使用编码后的数据训练加权极限学习机、使其输出正确的报告分类结果;
S5:使用训练好的加权极限学习机求出该加权极限学习机的局部泛化误差;
S6:使用差分进化算法中的交叉变异策略产生新的软件BUG稀疏权重矩阵;
S7:使用新的稀疏权重矩阵在相同不平衡数据集上训练新的加权极限学习机、并计算加权极限学习机的局部泛化误差;
S8:重复S6-S7操作直至无法得到更低的局部泛化误差;
S9:使用能够得到最低的局部泛化误差的加权极限学习机预测未知的软件BUG报告、得到其相应的报告分类结果。
2.根据权利要求1所述的方法,其特征还在于:S4中具体采用如下方式:
使用稀疏代价矩阵对极限学习机进行加权,该稀疏代价矩阵为对角矩阵,设该代价矩阵为W,其对角线上的每一个值costi,i=1,…,C,且Wii=0,i≠j,i,j=1,…,C,
原极限学习机的优化目标为:
其中公式中的第一项为l2正则项,H为极限学习机中的隐层输出矩阵,β为隐层与输出层之间的连接权重,Y为数据集标签;
极限学习机加入代价矩阵后,其优化目标为:
加权极限学习机输出层权重矩阵β其解为:
求出输出层权重矩阵后通过该矩阵与隐层输出矩阵H得到分类结果在训练集中
3.根据权利要求1所述的方法,其特征还在于:S5中具体采用如下方式:
S51:将局部泛化误差定义为:
给定Q>0和任意一个扰动向量Δx,使代表训练数据xi的Q近邻,表示除了xi之外不可见的所有样例,SQ表示所有SQ(xi)的集合,p(x)表示真实的概率密度函数,Loss(F(x;θ),f(x))表示求得分布与真实分布之间的差距;
局部泛化误差可以表示为:
其中输入扰动引起的输出波动通过随机灵敏度测量,即A,B,η分别表示目标输出的最大最小值之间的差、损失函数的最大值、以及约束的可信度;
此时有
局部泛化误差为:
基于S4中加权极限学习机的定义有:
最终结果即为在该加权极限学习机上的局部泛化误差,该值表示在所有未知的BUG报告上该分类器的误差有多大,即该值越大则该分类器的分类结果越不准确。
4.根据权利要求1所述的用于软件BUG分类的基于稀疏代价矩阵的进化极限学习机,其特征还在于:S6中具体采用如下方式。
S61:随机初始化多个稀疏代价矩阵,每个稀疏代价矩阵包含与BUG类别个数相同的代价权重;
S62:从初始化后的稀疏代价矩阵中随机选取三个不同的代价矩阵,分别为:cost1,cost2,cost3;
S63:使用选取的三个代价矩阵做突变操作产生一个新的代价矩阵:
h=cost1+Pm·(cost2-cost3)
其中Pm表示突变因子,新产生的代价矩阵为h;
S64:对新产生的代价矩阵做交叉操作、与上一代中相应的个体实现基因遗传:
其中i表示当前个体中的第几位,C表示所有类的个数,Pc表示交叉因子,cost表示上一代中与该新产生的个体相对应的个体,此时获得该次进化得到的稀疏权重矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连海事大学,未经大连海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010538383.3/1.html,转载请声明来源钻瓜专利网。