[发明专利]一种基于代码修改模式差异的缺陷纠错方法有效
申请号: | 201910170495.5 | 申请日: | 2019-03-07 |
公开(公告)号: | CN109918127B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 魏颖;孙小兵;李斌 | 申请(专利权)人: | 扬州大学 |
主分类号: | G06F8/75 | 分类号: | G06F8/75 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 董旭东;赵荔 |
地址: | 225000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了软件维护技术领域内的一种基于代码修改模式差异的缺陷纠错方法,包括以下步骤:先通过爬虫获取缺陷检索平台Bugzilla中状态为已解决的缺陷报告,按照缺陷报告ID的顺序将以不重复关系连接起来的缺陷报告形成一个簇;再利用TF‑IDF算法对各簇内缺陷的标题和描述进行关键词提取,并对其余缺陷报告进行关键词提取,并加入相应关键词的簇中;其次,对比每两个报告提交的源代码,得到代码克隆对,查找出每个缺陷报告中有源代码克隆部分的diff信息,分别对每份diff信息做修改模式差异图;最后,计算差异比例,判断缺陷的修改是否存在问题;本发明帮助开发人员更快速便捷地查找出已修改缺陷存在的问题。 | ||
搜索关键词: | 一种 基于 代码 修改 模式 差异 缺陷 纠错 方法 | ||
【主权项】:
1.一种基于代码修改模式差异的缺陷纠错方法,其特征在于,包括以下步骤:(1)通过爬虫获取缺陷检索平台Bugzilla中状态为resolved的缺陷报告,包括其title、description、缺陷间关系以及代码部分,并进行数据清洗,再按照缺陷报告ID的顺序将以duplicate关系连接起来的缺陷报告形成一个簇;(2)利用TF‑IDF算法对各簇内缺陷的title和description进行关键词提取,作为该簇的主题词;(3)在确认好簇的主题词后,再利用TF‑IDF算法对其余缺陷报告进行关键词提取,并加入相应关键词的簇中;(4)对于每个簇中的报告,运用一种称为CDLH的代码克隆检测算法对比每两个报告提交的源代码,并得到代码克隆对,查找出每个缺陷报告中有源代码克隆部分的diff信息,并分别对每份diff信息做修改模式差异图;(5)计算差异比例,若差异比例不小于65~75%,则认为两者大多做了同种修改,则其余缺陷的修改可能存在问题,并将有修复问题的缺陷发送给报告提出者进行重新检验、修复。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910170495.5/,转载请声明来源钻瓜专利网。