[发明专利]一种代码重复率扫描方法、装置、电子设备和存储介质在审
申请号: | 201911082092.1 | 申请日: | 2019-11-07 |
公开(公告)号: | CN112783552A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 李雪;张杰;黄威;张娜 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06F8/75 | 分类号: | G06F8/75 |
代理公司: | 北京恒博知识产权代理有限公司 11528 | 代理人: | 范胜祥 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 代码 重复 扫描 方法 装置 电子设备 存储 介质 | ||
本发明公开了一种代码重复率扫描方法、装置、电子设备和存储介质,其中,所述方法包括:接收待扫描的代码文件;将所述待扫描的代码文件划分为增量代码文件集和未修改的代码文件集,所述增量代码文件集中包括新增的代码文件和经修改的代码文件;对各所述文件集利用不同的策略进行重复率扫描;解析扫描结果,保存未记录文件对的重复率信息。通过上述增量扫描方案,能够显著地降低扫描时文件对的数量,并且能够提高代码扫描的速度,降低存储所需空间。
技术领域
本发明涉及静态代码扫描技术领域,具体涉及一种代码重复率扫描方法、装置、电子设备和存储介质。
背景技术
在代码静态扫描中,对代码行、复杂度、漏洞bug等的扫描,只在单个文件中进行,不同的文件之间没有关系,所以它们的增量扫描比较容易实现,只扫描新增或修改的文件即可。但静态代码的重复率计算的是一份代码中,两个文件(一个文件对)彼此之间的相似度,文件与文件之间并不独立。因此,要实现重复率的增量扫描,需要对扫描工具以及扫描结果的存储上进行改进。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种代码重复率扫描方法、装置、电子设备和存储介质。
依据本发明的一个方面,提供了代码重复率扫描方法,其中,所述方法包括:
接收待扫描的代码文件;
将所述待扫描的代码文件划分为增量代码文件集和未修改的代码文件集,所述增量代码文件集中包括新增的代码文件和经修改的代码文件;
对各所述文件集利用不同的策略进行重复率扫描;
解析扫描结果,保存未记录文件对的重复率信息。
可选的,所述将所述待扫描的代码文件划分为增量代码文件集和未修改的代码文件集包括:
获取最近一次代码扫描的路径信息;
将所述最近一次代码扫描的路径信息与本次代码扫描的路径信息进行对比,得到路径差异信息,根据所述路径差异信息确定增量代码文件集和未修改的代码文件集。
可选的,所述对各所述文件集利用不同的策略进行重复率扫描包括:
对所述增量代码文件集内的文件进行重复率扫描;
对增量代码文件集内的文件和未修改的文件集内的文件进行交叉重复率扫描。
可选的,所述对各所述文件集利用不同的策略进行重复率扫描包括:
为各所述文件集设置扫描属性,根据所属文件集的扫描属性对各所述文件集中的文件进行扫描。
可选的,所述解析扫描结果,保存未记录文件对的重复率信息包括:
根据所述重复行信息确定所述文件对的代码重复率;
然后按照预设格式记录所述文件对的信息。
可选的,所述信息包括如下的任一项或几项:按照预设规则顺序存储的文件对名称、文件对路径信息、重复率信息。
可选的,所述重复率信息包括如下的任一项或几项:重复代码的重复代码行数、起始行号和重复率。
依据本发明的另一方面,提供了一种代码重复率扫描装置,其中,所述装置包括:
接收单元,适于接收待扫描的代码文件;
分类单元,适于将所述待扫描的代码文件划分为增量代码文件集和未修改的代码文件集,所述增量代码文件集中包括新增的代码文件和经修改的代码文件;
扫描单元,适于对各所述文件集利用不同的策略进行重复率扫描;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911082092.1/2.html,转载请声明来源钻瓜专利网。