[发明专利]信息检测方法、装置及服务器在审

专利信息
申请号: 201910641145.2 申请日: 2019-07-16
公开(公告)号: CN110362968A 公开(公告)日: 2019-10-22
发明(设计)人: 李大伟;郑江林;关义春;龙凡;张金发;王贺;陆贝诺 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06F21/10 分类号: G06F21/10;G06F16/33
代理公司: 深圳翼盛智成知识产权事务所(普通合伙) 44300 代理人: 黄威
地址: 518057 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基因序列 待检测软件 敏感信息 信息检测 关键词匹配 开发平台 第三方 服务器 泄露 集合 相似度计算 基因集合 敏感数据 泄露检测 用户设置 自动判断 比对 查找 敏感 审计 申请 发现
【说明书】:

发明实施例公开了一种信息检测方法、装置及服务器。该信息检测方法包括:获取设置的关键词;在第三方开发平台的已公开代码中,查找与关键词匹配的软件基因序列,得到软件基因序列集合;获取待检测软件基因序列;将待检测软件基因序列,分别与软件基因集合中各软件基因序列进行相似度计算,确定软件基因序列集合中的敏感软件基因序列。本申请实施例中通过待检测软件基因序列与用户设置的关键词匹配的软件基因序列比对,自动判断出第三方开发平台的已公开代码是否存在敏感信息,大幅提升了敏感数据泄露检测的准确性,并减轻了人工审计判断的压力,使得企业可以及时发现并处理泄露的敏感信息,将敏感信息泄露的危害降到了最低。

技术领域

本发明涉及计算机技术领域,具体涉及一种信息检测方法、装置及服务器。

背景技术

近年来互联网的发展衍生出了门类齐全、功能丰富的第三方开放平台,都能以开放接口的方式提供给第三方开发者。第三方开发者无需在本地搭建服务的实际硬件及特殊软件环境,而是通过在云端管理软件开发和源代码,以第三方开源托管平台GitHub为例,作为开源代码库以及版本控制系统,目前Github平台拥有2400万位开发者和67000万个项目,下包含了过亿的文件数,随着越来越多的应用程序转移到了云上,Github已经成为了管理软件开发以及发现已有代码的首选方法。

但是,源代码泄露已引起越来越多开发人员重视,因此对第三方开放同平台中已有代码的敏感检测是非常有必要,目前,主要是人工进行敏感信息的审核检测,但由于互联网行业特有的开源行为、业界普遍使用的开源组件,以及互联网行业人员流动频繁,导致不同公司的项目代码存在大量相似性,且不同项目之间也存在复刻(fork)、引用等等原因,在查找敏感信息时,真正需要的结果极容易埋没在大量的无关信息中,这使得敏感信息检测变得非常困难。

发明内容

本申请提供一种信息检测方法、装置及服务器,大幅提升了敏感数据泄露检测的准确性,并减轻了人工审计判断的压力,使得企业可以及时发现并处理泄露的敏感信息,将敏感信息泄露的危害降到了最低。

第一方面,本申请提供一种信息检测方法,所述信息检测方法包括:

获取设置的关键词;

在第三方开发平台的已公开代码中,查找与所述关键词匹配的软件基因序列,得到软件基因序列集合;

获取待检测软件基因序列;

将所述待检测软件基因序列,分别与所述软件基因集合中各软件基因序列进行相似度计算,确定所述软件基因序列集合中的敏感软件基因序列。

在本申请一些实施例中,所述将所述待检测软件基因序列,分别与所述软件基因集合中各软件基因序列进行相似度计算,确定所述软件基因序列集合中的敏感软件基因序列,包括:

分别将所述软件基因序列集合中的软件基因序列作为目标软件基因序列,提取所述目标软件基因序列中的核心软件基因;

分别计算所述目标软件基因序列中各核心软件基因与所述待检测软件基因序列的相似度,得到所述各核心软件基因对应的第一相似度值;

根据所述各核心软件基因对应的第一相似度值,确定所述目标软件基因序列是否敏感软件基因序列。

在本申请一些实施例中,所述根据所述各核心软件基因对应的第一相似度值,确定所述目标软件基因序列是否敏感软件基因序列,包括:

获取所述待检测软件基因序列中各软件基因的权重值;

分别确定所述各核心软件基因与所述待检测软件基因序列中相似的软件基因;

根据所述各核心软件基因对应的第一相似度值,以及与所述待检测软件基因序列中相似的软件基因的权重值,计算所述目标软件基因序列与所述待检测软件基因序列的第二相似度值;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910641145.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top