[发明专利]一种bug、commit、相关人员关系建立方法有效
申请号: | 201610093332.8 | 申请日: | 2016-02-17 |
公开(公告)号: | CN105718376B | 公开(公告)日: | 2018-09-25 |
发明(设计)人: | 孙小兵;王经纬;王璐;李斌 | 申请(专利权)人: | 扬州大学 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06F17/30 |
代理公司: | 南京中新达专利代理有限公司 32226 | 代理人: | 孙鸥;朱杰 |
地址: | 225009 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 bug commit 相关 人员 关系 建立 方法 | ||
本发明涉及一种bug、commit、相关人员关系建立方法。本发明建立图形数据库,将bug、commit和人员的信息以节点的形式存储并将相互关联的节点连接起来可以有效的解决这一问题,图形数据库是一种非关系型数据库,它应用图形理论存储实体之间的关系信息。本发明克服了大多数的程序设计领域的问答网站存在的效率低下、不提供与之相关的commit与技术人员的信息以及需要进行大量的查询产生性能上的缺陷等。本发明构建了一个bug对象、commit对象和人员对象三者之间的对应关系,并以这三个对象为节点,以这三者关系为边的关系网络,快速高效的帮助用户了解问题、解决问题,向用户提供一个全面的知识网络,解决关系型数据库在处理大量数据时性能下降的问题。
技术领域
本发明属于软件调试领域,特别涉及一种bug、commit、相关人员关系建立方法。
背景技术
由于软件复杂性的增加,软件开发和维护过程中出现的bug的数目不断增加;另外,软件开发公司的人员频繁的流动,经常会有开发人员遇到一些自己无法解决的bug,由此产生了很多程序设计领域的问答网站(如Stack Overflow、bugzilla@Mozilla)。如何让用户快速准确的进行搜索,更快速解决自己所遭遇的问题成了急需解决的问题。
在本发明做出之前,大多数的程序设计领域的问答网站所提供的搜索功能都基于关系型数据库。他们实现的原理是由用户输入的搜索内容去数据库中查询与之类似的数据返回给用户。用户可以参考返回的结果对比自己的问题寻找解决问题的思路。但是这种方法却存在着以下的几个的缺陷:1、随着数据库中bug的数量、种类不断增加,复杂性不断加大,用户搜索的结果集经常有几十甚至上百条,用户需要在这个结果集中再次进行人工搜索,效率低下。2、系统所提供的结果仅仅包含类似的问题信息,而并不提供与之相关的commit与技术人员的信息。不能有效地帮助用户了解自己所面临的问题,用户需要再次搜索类似bug的commit才能解决自己的问题。3、当关系型数据库中数据量十分庞大时,需要进行大量的查询,产生性能上的问题。
发明内容
本发明的目的就在于克服上述缺陷,研制一种bug、commit和相关人员的关系建立方法。
本发明的技术方案是:
一种bug、commit、相关人员关系建立方法,其主要技术特征在于步骤如下:(1)抽取和识别bug源文件、commit源文件、人员源文件中每个bug、commit、人员的实体与属性,进行预处理,并分别建立bug对象、commit对象、人员对象;
(2)使用python的nltk包构建一个带监督的分类器,以bugzilla中的keywords列表中的关键词作为label构建训练语料库,在这个语料库的基础上构建分类器,对于输入的每一个bug对象、commit对象或人员对象,首先对它的描述信息经行分词,然后抽取其中的高频词对bug对象、commit对象和人员对象进行分类,生成bug对象、commit对象、人员对象的分类文件;
(3)根据bug对象与commit对象之间一个bug对象对应一个或多个commit对象的对应关系建立联系,根据bug对象的duplicate、depends on和block属性建立bug对象之间的联系,bug对象的reporter属性建立bug对象和人员对象之间的联系,根据commit对象的committer属性建立commit对象与人员对象之间的关系,根据人员对象的关注领域构建人员对象之间的联系,最后生成bug对象、commit对象、人员对象之间对应关系的文件;
(4)综合步骤(2)、步骤(3)的bug对象、commit对象、人员对象之间对应关系的文件给相似的bug对象、相似的commit对象之间建立联系,关注相似的bug对象或commit对象的人员对象之间建立联系,形成完整的bug对象、commit对象和人员对象之间的图形数据关系,最后将bug对象、commit对象、人员对象之间的相互关系以bug_id为序保存为csv格式文件;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610093332.8/2.html,转载请声明来源钻瓜专利网。