[发明专利]一种软件识别方法、系统、设备及计算机可读存储介质在审
申请号: | 202110745013.1 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113569206A | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 郭开;刘彦南;赖雅斌;杨帆 | 申请(专利权)人: | 深信服科技股份有限公司 |
主分类号: | G06F21/12 | 分类号: | G06F21/12;G06F21/44 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 张金香 |
地址: | 518055 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 软件 识别 方法 系统 设备 计算机 可读 存储 介质 | ||
本申请公开了一种软件识别方法、系统、设备及计算机可读存储介质,确定待识别的目标软件;获取目标软件在预设数量的客户端上的各个目标文件路径;确定各个目标文件路径间的差异程度;判断差异程度是否在预设阈值范围内;若差异程度在预设阈值范围内,则确定目标软件为正常软件;若差异程度在预设阈值范围外,则确定目标软件为异常软件。本申请中,只需对目标软件在预设数量的客户端上的各个目标文件路径进行差异程度判断,便可以根据差异程度判断结果确定目标软件是否为正常软件,与人工识别软件相比,效率高且准确性好。本申请提供的软件识别系统、设备及计算机可读存储介质也解决了相应技术问题。
技术领域
本申请涉及软件识别技术领域,更具体地说,涉及一种软件识别方法、系统、设备及计算机可读存储介质。
背景技术
在计算机中,行业软件是针对特定行业而专门制定的、具有明显行业特性的软件,且有部分行业软件比较小众。在客户端应用行业软件等软件的过程中,人工先判断软件是否为正常软件,若是,则将该软件标记为正常软件,这样,客户端可以直接应用该软件,若否,则将该软件标记为异常软件,以提示客户端不能直接应用该软件。
然而,在软件的识别过程中,人工审核存在误审或漏审的情况,导致软件的识别准确性不高,存在误报或者漏报的情况,不利用软件被客户端应用。
综上所述,如何准确对软件进行识别是目前本领域技术人员亟待解决的问题。
发明内容
本申请的目的是提供一种软件识别方法,其能在一定程度上解决如何准确对软件进行识别的技术问题。本申请还提供了一种软件识别系统、设备及计算机可读存储介质。
为了实现上述目的,第一方面,本申请提供一种软件识别方法,包括:
确定待识别的目标软件;
获取所述目标软件在预设数量的客户端上的各个目标文件路径;
确定各个所述目标文件路径间的差异程度;
判断所述差异程度是否在预设阈值范围内;
若所述差异程度在所述预设阈值范围内,则确定所述目标软件为正常软件;
若所述差异程度在所述预设阈值范围外,则确定所述目标软件为异常软件。
优选的,所述获取所述目标软件在预设数量的客户端上的各个目标文件路径,包括:
获取所述目标软件在预设数量的客户端上的各个初始文件路径;
过滤掉各个所述初始文件路径中的系统文件目录,得到各个所述目标文件路径。
优选的,所述确定各个所述目标文件路径间的差异程度,包括:
对各个所述目标文件路径进行向量化表示,得到对应的目标向量值;
计算所有的所述目标向量值的波动程度;
将所述波动程度作为所述差异程度。
优选的,所述计算所有的所述目标向量值的波动程度,包括:
计算所有的所述目标向量值的目标方差值;
将所述目标方差值作为所述波动程度。
优选的,所述对各个所述目标文件路径进行向量化表示,得到对应的目标向量值,包括:
对于各个所述目标文件路径,均按照目录分隔符对所述目标文件路径进行分割,得到目录词汇,将所述目录词汇转换为对应的第一向量值,基于所述第一向量值确定所述目标向量值。
优选的,所述基于所述第一向量值确定所述目标向量值,包括:
将所述第一向量值的中心值作为所述目标向量值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深信服科技股份有限公司,未经深信服科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110745013.1/2.html,转载请声明来源钻瓜专利网。