[发明专利]一种基于主动学习的缺陷报告严重程度预测方法在审
| 申请号: | 202210417496.7 | 申请日: | 2022-04-20 |
| 公开(公告)号: | CN114579471A | 公开(公告)日: | 2022-06-03 |
| 发明(设计)人: | 葛骅;陈翔;孟千爽;吴媛媛;林浩;夏鸿崚;顾亚锋 | 申请(专利权)人: | 南通大学 |
| 主分类号: | G06F11/36 | 分类号: | G06F11/36;G06K9/62 |
| 代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 张俊俊 |
| 地址: | 226019 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 主动 学习 缺陷 报告 严重 程度 预测 方法 | ||
本发明提供了一种基于主动学习的缺陷报告严重程度预测方法,属于软件质量保障技术领域。解决了缺陷报告预测模型构建过程耗费大量人工成本进行缺陷报告严重程度标签的手工标记。其技术方案为:首先从项目所在的缺陷跟踪系统中,搜集历史缺陷报告并下载,对下载的数据集进行预处理,得到目标缺陷报告数据集;然后使用基于主动学习的逻辑回归分类方法,构建缺陷报告严重程度预测模型。本发明的有益效果为:该发明使用基于主动学习的逻辑回归分类方法,因其使用了逻辑回归分类方法,具有易实现、执行效率高、效果好的的优点;使用主动学习方法可在较少的人工成本下,进一步提高模型的预测能力。
技术领域
本发明涉及软件质量保障技术领域,尤其涉及一种基于主动学习的缺陷报告严重程度预测方法。
背景技术
软件缺陷报告严重程度预测通过挖掘软件历史库(例如版本控制系统、缺陷跟踪系统等),构建软件缺陷报告严重程度预测模型,来自动标注软件缺陷报告严重程度,通过根据软件缺陷报告严重程度将相应的软件缺陷分配给合适的开发人员,可以优化软件缺陷修复资源的分配,从而有效地提高软件产品的质量。
为了尽可能准确地预测软件缺陷报告严重程度、减少软件缺陷报告数据集中各类别数量不平衡问题带来的负面影响,有必要考虑结合类不平衡方法和软件缺陷报告summary字段的句子向量表达方法,并设计出软件缺陷严重程度预测方法。
发明内容
本发明的目的在于提供一种基于主动学习的缺陷报告严重程度预测方法,本发明采用逻辑回归分类方法构建缺陷报告严重程度预测模型,首先从项目所在的缺陷跟踪系统中搜集历史缺陷报告,并抽取摘要信息summary字段和严重程度severity字段对应的内容得到软件缺陷报告数据集D_BR作为训练数据集,然后进行预处理并使用fastText生成缺陷报告的对应向量,最后使用基于主动学习的逻辑回归分类方法构建缺陷报告严重程度预测模型;该发明采用基于主动学习的逻辑回归分类方法构建预测模型,具有易实现、执行效率高、效果好的的优点,并且缓解人工标记缺陷报告对应标签的成本,进一步提高预测模型的性能。
为了实现上述发明目的,本发明采用技术方案具体为:一种基于主动学习的缺陷报告严重程度预测方法,具体包括以下步骤:
(1)、从项目所托管的软件缺陷跟踪系统中,搜集历史缺陷报告,针对每一份缺陷报告,抽取所述缺陷报告摘要信息summary、描述信息description两个属性的信息,构建缺陷报告数据集DBR;
(2)、对所述缺陷报告数据集DBR进行预处理,得到所述缺陷报告中每个摘要信息summary所对应的向量和每个描述信息description所对应的向量;
具体地,对缺陷报告数据集DBR中对应的摘要信息summary和描述信息description进行文本预处理,包括对所述摘要信息summary和描述信息description进行分词,还原词根,去除特殊符号,过滤停用词,停用词是指在文本中经常出现,但含有极少文本信息的高频词,使用TextRank模型抽取描述信息description中的关键字,将所述关键字用空格拼接得到新的描述信息description;其中,TextRank算法是一种基于图的用于关键词抽取和文档摘要的排序算法;接着,将所述摘要信息summary和描述信息description输入fastText模型,分别得到所述摘要信息summary对应的向量和描述信息description对应的向量;其中,fastText模型是一种深度神经网络,能够将文本转化为向量;
(3)、对所述缺陷报告数据集DBR,将其中每个缺陷报告所对应的摘要信息summary向量和描述信息description向量首尾相连,得到缺陷报告所对应的向量;
(4)将所述缺陷报告数据集DBR按照3:1的比例划分为训练集Dtrain和验证集Dvalid;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210417496.7/2.html,转载请声明来源钻瓜专利网。





