[发明专利]信息、笔记信息、代码检测方法、设备及存储介质在审
| 申请号: | 202010270213.1 | 申请日: | 2020-04-08 |
| 公开(公告)号: | CN113496035A | 公开(公告)日: | 2021-10-12 |
| 发明(设计)人: | 喻煜阳 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06F21/56 | 分类号: | G06F21/56 |
| 代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 张爱;刘戈 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 信息 笔记 代码 检测 方法 设备 存储 介质 | ||
1.一种信息检测方法,其特征在于,包括:
获取待检测内容;
根据预设的检测规则,从待检测内容中检测出疑似敏感信息;
根据设定的过滤方式,从疑似敏感信息中过滤出目标敏感信息。
2.根据权利要求1所述的方法,其特征在于,在根据预设的检测规则,从待检测内容中检测出疑似敏感信息之前,还包括:
根据待检测内容的类型,在待检测内容的类型与检测规则和过滤方式的映射关系中进行匹配,以获取待检测内容对应的检测规则和过滤方式。
3.根据权利要求1所述的方法,其特征在于,根据预设的检测规则,从待检测内容中检测出疑似敏感信息,包括:
利用已有的规则匹配模板,从待检测内容中匹配出包含敏感信息的片段,作为疑似敏感信息;
对待检测内容中未包含敏感信息的片段进行信息熵检测,以获得疑似敏感信息。
4.根据权利要求3所述的方法,其特征在于,利用已有的规则匹配模板,从待检测内容中匹配出包含敏感信息的片段,包括:
以行为单位将待检测内容中的内容切分为至少一个待检测片段;
分别计算每个待检测片段与各规则匹配模板之间的匹配度;
将至少一个待检测片段中的匹配度大于匹配阈值的片段,作为疑似敏感信息。
5.根据权利要求3所述的方法,其特征在于,对待检测内容中未包含敏感信息的片段进行信息熵检测,以获得疑似敏感信息,包括:
针对第一片段,根据第一片段对应的语法,将第一片段拆分为至少一个子片段,其中,第一片段是所述未包含敏感信息的片段中的任一片段;
计算至少一个子片段的信息熵;
将至少一个子片段中信息熵大于设定信息熵阈值的子片段,作为疑似敏感信息。
6.根据权利要求1所述的方法,其特征在于,根据设定的过滤方式,从疑似敏感信息中过滤出目标敏感信息,包括:
根据第一类过滤方式,从疑似敏感信息中过滤出候选疑似敏感信息;
根据候选疑似敏感信息的定义类型,从第二类过滤方式中选择与所述定义类型对应的目标过滤方式;
利用所述目标过滤方式对候选疑似敏感信息进行过滤,以确定出目标敏感信息。
7.根据权利要求6所述的方法,其特征在于,根据第一类过滤方式,从疑似敏感信息中过滤出候选疑似敏感信息,包括:
结合疑似敏感信息对应的上下文和/或文件类型,从疑似敏感信息中过滤出候选疑似敏感信息。
8.根据权利要求7所述的方法,其特征在于,结合疑似敏感信息对应的上下文,从疑似敏感信息中过滤出候选疑似敏感信息,包括:
在疑似敏感信息的上下文中查找特定信息;
若未查找到特定信息,则将所述疑似敏感信息确定为候选疑似敏感信息。
9.根据权利要求7所述的方法,其特征在于,结合疑似敏感信息对应的文件类型,从疑似敏感信息中过滤出候选疑似敏感信息,包括:
判断疑似敏感信息对应的文件类型是否属于指定文件类型;
若是,则降低疑似敏感信息的敏感等级或者确定疑似敏感信息不属于目标敏感信息。
10.根据权利要求6所述的方法,其特征在于,若待检测内容为代码文件,所述第二类过滤方式包括语法过滤方式、语义过滤方式和信息熵过滤方式中的至少一种;
根据候选疑似敏感信息的定义类型,从第二类过滤方式中选择与所述定义类型对应的目标过滤方式,包括:
识别候选疑似敏感信息的定义类型;
若所述定义类型为自定义类型,则选择语法过滤方式作为目标过滤方式;
若所述定义类型为非自定义类型,则选择语法过滤方式、语义过滤方式和信息熵过滤方式中的至少一种方式作为目标过滤方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010270213.1/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





