[发明专利]一种基于决策树的软件需求预测方法、装置及可读存储介质在审
申请号: | 202310343294.7 | 申请日: | 2023-03-31 |
公开(公告)号: | CN116431489A | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 刘军辉;赵晓丹;章岩;闫鑫;冷炜 | 申请(专利权)人: | 中信银行股份有限公司 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06F40/216;G06F40/18;G06F16/35;G06F18/243 |
代理公司: | 北京市兰台律师事务所 11354 | 代理人: | 张博;张峰 |
地址: | 100020 北京市朝阳区光*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 决策树 软件 需求预测 方法 装置 可读 存储 介质 | ||
1.一种基于决策树的软件需求预测方法,其特征在于,包括:
S1、获取历史软件需求说明书,基于软件需求说明书提取软件需求特征关键词;
S2、基于软件需求特征关键词建立第一需求特征词表和第一需求特征词频次表;
S3、在根据历史软件需求说明书形成决策树模型的过程中,迭代计算各特征词下每个频次的信息增益,并根据最大信息增益对应的特征词划分当前特征词包含的数据集,以基于当前特征词分裂形成多个子特征词分支并进一步根据信息增益最大的字特征词划分数据集,直至子特征词满足第一预设条件后,建立决策树结束,所述第一预设条件包括最终划分各个子数据集的子特征词频次的信息增益相同;
S4、输入待预测的软件需求说明书,基于上述决策树预测软件需求的测试范围。
2.根据权利要求1所述的方法,其特征在于,所述S1包括:
S11、按照第一预设规则将历史软件需求说明书进行初分类,其中,所述第一预设规则包括软件需求的历史测试相同范围大于预设阈值;
S12、基于分类后的软件需求说明书,按照第一特征词重要程度规则计算特征词的重要程度,第一特征词重要程度规则包括基于TF-IDF计算特征词的关键程度,其中TF指的是词频,IDF指的是逆向文件频率;
S13、选取重要程度从大到小的第一数量的特征词作为特征关键词。
3.根据权利要求1所述的方法,其特征在于,所述S2还包括将第一需求特征词表和第一需求特征词频次表合并形成第一特征集。
4.根据权利要求3所述的方法,其特征在于,所述S3包括:
S31、首先计算每个特征词下的频次的信息增益,并选择信息增益或信息增益率最大的特征词的频次将历史软件需求说明书划分第一样本集与第二样本集;
S32、删除第一特征集中的上述信息增益或信息增益率最大的特征词,在第一样本集与第二样本集里迭代计算信息增益或信息增益率最大的特征词的频次并将其命名为第二层分支特征词,基于第二层分支特征词划分第一样本集与第二样本集;以此类推划分历史软件需求说明书的样本集,直至子特征词满足第一预设条件后,建立决策树结束。
5.根据权利要求1所述的方法,其特征在于,所述S3中的信息增益还可以是信息增益率,所述第一预设条件还包括遍历特征词结束。
6.根据权利要求1所述的方法,其特征在于,所述S3之后还包括,基于未投入建立决策树模型的历史软件需求说明书检验所述决策树模型的有效性。
7.根据权利要求1所述的方法,其特征在于,所述S4包括:
S41、对待预测的软件需求说明书进行预处理,提取待预测的软件需求说明书的软件需求特征关键词;
S42、将上述软件需求特征关键词输入决策树模型预测软件需求的测试范围。
8.一种基于决策树的软件需求预测装置,其特征在于,包括:
获取模块,用于获取历史软件需求说明书,基于软件需求说明书提取软件需求特征关键词;
建立模块,用于基于软件需求特征关键词建立第一需求特征词表和第一需求特征词频次表;
建立决策树模型模块,用于在根据历史软件需求说明书形成决策树模型的过程中,迭代计算各特征词下每个频次的信息增益,并根据最大信息增益对应的特征词划分当前特征词包含的数据集,以基于当前特征词分裂形成多个子特征词分支并进一步根据信息增益最大的字特征词划分数据集,直至子特征词满足第一预设条件后,建立决策树结束,所述第一预设条件包括最终划分各个子数据集的子特征词频次的信息增益相同;
预测模块,用于输入待预测的软件需求说明书,基于上述决策树预测软件需求的测试范围。
9.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1-8中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-8中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中信银行股份有限公司,未经中信银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310343294.7/1.html,转载请声明来源钻瓜专利网。