[发明专利]一种基于卷积和循环神经网络的软件Bug分派方法在审

专利信息
申请号: 201811528908.4 申请日: 2018-12-13
公开(公告)号: CN109615241A 公开(公告)日: 2019-04-12
发明(设计)人: 陈荣;王林辉;王芝;李辉;郭世凯 申请(专利权)人: 大连海事大学
主分类号: G06Q10/06 分类号: G06Q10/06;G06F16/35;G06F17/27
代理公司: 大连东方专利代理有限责任公司 21212 代理人: 姜玉蓉;李洪福
地址: 116026 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 分派 样本 循环神经网络 软件Bug 卷积 单词 预处理 上下文特征 语义 层次关系 输入完成 特征提取 文本信息 依赖关系 测试集 数据集 训练集 概率 句子 收敛 量化 测试 开发 返回 挖掘
【权利要求书】:

1.一种基于卷积和循环神经网络的软件Bug分派方法,其特征在于:包括以下步骤:

S1:从选定的开源项目中获取原始bug报告数据集,并对其进行预处理成训练集和测试集;

S2:将训练集中的样本依次输入CLBT模型中,训练CLBT模型中所有的参数直至收敛完成该模型的训练;

S3:将测试集中的样本依次输入完成训练的CLBT模型中,每个样本都返回一个针对全部开发者的推荐概率,将该样本分派给概率最大的开发者。

2.根据权利要求1所述的一种基于卷积和循环神经网络的软件Bug分派方法,其特征还在于:S1中具体采用如下方式:

S11:筛选bug报告:保留确认被修复bug报告,删除修复bug报告数量过少的开发者及由他们修复的bug报告;

S12:提取文本信息:对bug报告的文本信息进行分词、词干化和去停用词,删掉出现频率过高或者过低的单词;

S13:提取开发者活跃度信息:从每条bug报告对应的时间节点向前推移一段时间,统计这段时间内跟当前bug报告同属一类的历史bug报告,依次提取同属一类的历史bug报告的修复者,组成当前bug报告的开发者修复序列;

S14:将完成预处理的数据集划分成训练集和测试集。

3.根据权利要求1所述的一种基于卷积和循环神经网络的软件Bug分派方法,其特征还在于:S2中建立并训练CLBT模型具体采用如下方式:

S21:编码文本信息和开发者活跃度信息:使用一位有效码将所有单词处理成等长的向量,对开发者同样处理成等长的向量;

S22:将编码好的文本向量输入双向循环神经网络,来抽取单词之间的语序特征;

S23:提取单词的语义及其上下文特征:将编码好的文本向量输入卷积神经网络,使用多个大小不相等的卷积核在单词序列上滑动以获取高层特征,得到多个不同卷积核下的特征映射,对该特征映射采用最大池化的方式降低输出的维度、保留显著特征,将保留的显著特征作为提取的高层特征;

S24:将编码好的开发者活跃度信息输入单向循环神经网络,抽取开发者活跃度的高层特征;

S25:将S22至S24中产生的语序特征、语义及其上下文特征和开发者活跃度的高层特征以元素间相乘的方式进行融合,将融合后的特征输入到输出层;

S26:输出层经过softmax函数的计算之后,得到对每个开发者的推荐概率。

4.根据权利要求1所述的一种基于卷积和循环神经网络的软件Bug分派方法,其特征还在于:S3中具体采用如下方式:

S31:读取训练好的神经网络模型,维持所有参数不变,输入经过预处理的测试集;

S32:针对测试集中的每个样本,返回开发者推荐列表。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连海事大学,未经大连海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811528908.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top