[发明专利]一种基于卷积和循环神经网络的软件Bug分派方法在审

专利信息
申请号: 201811528908.4 申请日: 2018-12-13
公开(公告)号: CN109615241A 公开(公告)日: 2019-04-12
发明(设计)人: 陈荣;王林辉;王芝;李辉;郭世凯 申请(专利权)人: 大连海事大学
主分类号: G06Q10/06 分类号: G06Q10/06;G06F16/35;G06F17/27
代理公司: 大连东方专利代理有限责任公司 21212 代理人: 姜玉蓉;李洪福
地址: 116026 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 分派 样本 循环神经网络 软件Bug 卷积 单词 预处理 上下文特征 语义 层次关系 输入完成 特征提取 文本信息 依赖关系 测试集 数据集 训练集 概率 句子 收敛 量化 测试 开发 返回 挖掘
【说明书】:

发明公开了一种基于卷积和循环神经网络的软件Bug分派方法,包括以下步骤:S1:从选定的开源项目中获取原始bug报告数据集,并对其进行预处理成训练集和测试集;S2:将训练集中的样本依次输入CLBT模型中,训练CLBT模型中所有的参数直至收敛完成该模型的训练;S3:将测试集中的样本依次输入完成训练的CLBT模型中,每个样本都返回一个针对全部开发者的推荐概率,将该样本分派给概率最大的开发者。该方法首选对整个句子的层次关系和单词之间的长短依赖关系做了量化的特征提取,在考虑了已有技术中词序信息,同时进一步提取了单词的语义和上下文特征来参与bug报告的分派工作,对文本信息进行了更加充分有效的挖掘利用。

技术领域

本发明涉及软件测试技术领域,尤其涉及一种基于卷积和循环神经网络的软件Bug分派方法。

背景技术

软件Bug,即软件故障,是软件开发过程中不可避免的产物。及时修复软件中的bug以维护系统的正确性,是保证软件质量的前提。为了利于收集和管理软件bug,软件开发者设计了软件Bug仓库(Bug Repository),来存储和维护软件bug,Bug仓库的管理人员通过审阅Bug报告来指派合适的开发者对Bug进行修复。随着软件开发技术的进一步成熟,软件bug的数量大大增加,传统的通过人工进行Bug指派的方式因为耗时大、效率低,已经远远不能满足目前的需要。所以研究者们提出使用机器学习来进行自动化Bug分派,从而将Bug分派问题转换成了文本分类问题,成为了时下的一个研究热点。但是很多研究并没有对文本信息进行充分的挖掘,他们往往忽视了文本的语序和上下文特征。另外,相关技术在判断相似开发者时表现也很差。

发明内容

根据现有技术存在的问题,本发明公开了一种基于卷积和循环神经网络的软件Bug分派方法,包括:以下步骤:

S1:从选定的开源项目中获取原始bug报告数据集,并对其进行预处理成训练集和测试集;

S2:将训练集中的样本依次输入CLBT模型中,训练CLBT模型中所有的参数直至收敛完成该模型的训练;

S3:将测试集中的样本依次输入完成训练的CLBT模型中,每个样本都返回一个针对全部开发者的推荐概率,将该样本分派给概率最大的开发者;

进一步的,S1中具体采用如下方式:

S11:筛选bug报告:保留确认被修复bug报告,删除修复bug报告数量过少的开发者及由他们修复的bug报告;

S12:提取文本信息:对bug报告的文本信息进行分词、词干化和去停用词,删掉出现频率过高或者过低的单词;

S13:提取开发者活跃度信息:从每条bug报告对应的时间节点向前推移一段时间,统计这段时间内跟当前bug报告同属一类的历史bug报告,依次提取同属一类的历史bug报告的修复者,组成当前bug报告的开发者修复序列;

S14:将完成预处理的数据集划分成训练集和测试集;

进一步的,S2中建立并训练CLBT模型具体采用如下方式:

S21:编码文本信息和开发者活跃度信息:使用一位有效码将所有单词处理成等长的向量,对开发者同样处理成等长的向量;

S22:将编码好的文本向量输入双向循环神经网络,来抽取单词之间的语序特征;

S23:提取单词的语义及其上下文特征:将编码好的文本向量输入卷积神经网络,使用多个大小不相等的卷积核在单词序列上滑动以获取高层特征,得到多个不同卷积核下的特征映射,对该特征映射采用最大池化的方式降低输出的维度、保留显著特征,将保留的显著特征作为提取的高层特征;

S24:将编码好的开发者活跃度信息输入单向循环神经网络,抽取开发者活跃度的高层特征;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连海事大学,未经大连海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811528908.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top