[发明专利]一种三维曲面表示的软件错误定位方法有效
| 申请号: | 201410033461.9 | 申请日: | 2014-01-23 |
| 公开(公告)号: | CN103744789B | 公开(公告)日: | 2017-01-11 |
| 发明(设计)人: | 张震宇;石琼;李恒 | 申请(专利权)人: | 中国科学院软件研究所 |
| 主分类号: | G06F11/36 | 分类号: | G06F11/36 |
| 代理公司: | 北京科迪生专利代理有限责任公司11251 | 代理人: | 成金玉,杨学明 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 三维 曲面 表示 软件 错误 定位 方法 | ||
技术领域
本发明属于软件测试技术领域,主要涉及软件调试范畴的“统计错误定位方法”。本发明采用三维曲面表示对错误定位的可疑度函数的性质进行可视化并假以分析,利用软件开发工作中的真实错误模式对可疑度函数进行校正和优化。
背景技术
软件在日常生活中的应用越来越广泛。随着软件功能和架构的复杂化,想要在软件产品中彻底避免软件错误的出现,仍然是很困难的。软件错误,即导致软件实际运行的结果和预期的运行结果不相符的那些因素,这些错误的存在,导致软件相应的功能丧失。软件测试是用于发现和修改软件错误的常用手段,是一项十分重要但又代价很大的工程,它通常包括三个步骤:错误的定位、错误的修复和对修改后的代码的再测试。其中,错误的定位是最为重要也是最为费时和费力的过程。
语句级别的“统计错误定位方法”通过收集每条语句在程序执行失败或成功时的运行信息来分析和评估该语句存在错误的可疑程度。举例来说,若某条语句总是在失败的程序执行中被运行,而从未在成功的程序执行中被运行过,那么,它很可能是和软件错误相关的。在此类“统计错误定位方法”中,通常采用可疑度函数来评估语句存在错误的可能性。
在进行错误定位时,首先需要多次执行程序,统计程序执行失败的次数m和语句si的运行次数failed(si),以及程序执行成功的次数m′和语句si的运行次数passed(si);然后根据可疑度函数来评估每条语句存在错误的可能性,按照可疑值从大到小对语句进行排序;最后根据这个排序来逐个查找程序中的错误。对于目前的大部分可疑度函数(如Tarantula、Jaccard、Ochiai、SBI)而言,一条语句si的可疑度RT(si)只与两个变量有关——该语句在失败的程序执行中运行的次数failed(si)和该语句在成功的程序执行中运行的次数passed(si)。
然而,单纯地利用failed(si)和passed(si)来评估语句可疑度的方法与实际情况相差甚远。在实际编程时,错误并不是随机地、毫无规律地出现,而是呈现出某种模式:某些程序结构可能会频繁地出现错误,而另外一些程序结构可能很少出现错误。例如,对C语言的研究表明,有22.8%的错误出现在函数入口处或赋值语句上,相反,只有7.8%的错误出现在函数出口处或返回语句上,最终结果使软件错误定位准确度不高。
发明内容
本发明技术解决问题:克服现有技术的不足,提供一种三维曲面表示的软件错误定位方法,采用三维曲面对错误定位技术的可疑度函数进行可视化分析,利用错误模式对三维曲面进行校正和优化,使得可疑度函数更符合实际情况,从而提高错误定位技术的准确度。本发明技术解决方案:一种三维曲面表示的软件错误定位方法,实现步骤如下:
(1)提取训练集中各程序的错误语句的运行特征,选择某种可疑度函数,计算错误语句的可疑度,然后对这些错误语句进行聚类;所述错误语句的运行特征包括该错误语句在失败的程序执行中运行的次数和在成功的程序执行中运行的次数;
(2)根据每个聚类中错误语句的运行特征和相应的可疑度值,对每个聚类进行中心化,获取该聚类的中心,以获取每个聚类的某种特性,每个聚类中心的特征就代表了一种错误模式;
(3)将所述聚类中心拟合成三维曲面,该三维曲面函数就是经过校正和优化后的可疑度函数;
(4)运行测试集中的程序,根据所述程序的执行信息,利用所述经过校正和优化后的可疑度函数计算程序中各语句的可疑度,按照可疑度值的大小对各语句进行排序,得到可疑度排位表,根据可疑度排位表,对程序语句逐条排查,定位程序中的错误;所述执行信息包括程序执行成功与否,以及程序每条语句分别在成功的程序执行中的运行次数和在失败的程序执行中的运行次数。
所述步骤(1)选择可疑度函数采用Tarantula,Jaccard,Ochiai或SBI函数计算所述错误语句的可疑度。
所述步骤(1)中的聚类方法采用KNN算法或K-means算法。
所述步骤(2)根据错误语句在失败的程序中运行的次数,在成功的程序中运行的次数以及该错误语句的可疑度值,分别求取它们的均值来对聚类进行中心化。
所述步骤(3)采用样条插值方法或将这些聚类中心拟合成三维曲面。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410033461.9/2.html,转载请声明来源钻瓜专利网。





