[发明专利]一种敏感数据识别方法及装置在审
申请号: | 202110597331.8 | 申请日: | 2021-05-31 |
公开(公告)号: | CN113177233A | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 杜晋瑞;陈勇铨;周华;江俊 | 申请(专利权)人: | 上海英方软件股份有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/2455;G06F16/22 |
代理公司: | 上海国智知识产权代理事务所(普通合伙) 31274 | 代理人: | 潘建玲 |
地址: | 200011 上海市黄*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 敏感数据 识别 方法 装置 | ||
1.一种敏感数据识别方法,包括如下步骤:
步骤S1,建立敏感类型模型,并确定敏感数据匹配比率;
步骤S2,扫描欲进行敏感数据识别的数据库,根据其中各表的各维度信息确定相应的敏感类型模型;
步骤S3,随机抽取所述数据库中每个表每列的若干数据,将其与确定的敏感类型模型匹配,根据匹配结果判断每列数据是否属于敏感类型。
2.如权利要求1所述的一种敏感数据识别方法,其特征在于,步骤S1进一步包括:
步骤S100,根据通用的敏感数据定义,建立通用的敏感类型模型;
步骤S101,自定义敏感类型,根据自定义的敏感类型建立自定义的敏感数据模型;
步骤S102,定义并预设敏感数据匹配比率。
3.如权利要求2所述的一种敏感数据识别方法,其特征在于:于步骤S2中,扫描欲进行敏感数据识别的数据库,提取所述数据库的库名、表名、表注释,针对各个表获取列名及列注释并进行判断,从而确定相应的敏感类型模模型。
4.如权利要求3所述的一种敏感数据识别方法,其特征在于,步骤S3进一步包括:
步骤S300,对所述数据库的每张表每列数据随机抽取预设数量数据;
步骤S301,根据步骤S2确定的敏感类型模型对抽取的当前列数据一一进行匹配,确定其是否与步骤S2中确定的敏感类型模型匹配;
步骤S302,根据步骤S301的匹配结果与步骤S1定义的敏感数据匹配比率,确定当前列数据是否属于敏感类型。
5.如权利要求4所述的一种敏感数据识别方法,其特征在于,于步骤S300中,若当前表当前列的数据量大于预设阈值时,则抽取预设阈值量的数据;若当前表当前列的数据量小于或等于预设阈值时,则将当前表当前列的数据全部抽取。
6.如权利要求5所述的一种敏感数据识别方法,其特征在于:于步骤S302中,当根据步骤S301的匹配结果,与步骤S2中确定的敏感类型模型匹配的数据量与抽取总量的比值大于步骤S1定义的敏感数据匹配比率,则确定当前列数据属于敏感类型。
7.一种敏感数据识别装置,包括如下步骤:
敏感类型模型构建单元,用于建立敏感类型模型,并确定敏感数据匹配比率;
敏感类型模型确定单元,用于扫描欲进行敏感数据识别的数据库,根据其中各表的各维度信息确定相应的敏感类型模型;
敏感数据识别单元,用于随机抽取所述数据库中每个表每列的若干数据,将其与确定的敏感类型模型匹配,根据匹配结果判断每列数据是否属于敏感类型。
8.如权利要求7所述的一种敏感数据识别装置,其特征在于,所述敏感类型模型构建单元进一步包括:
通用敏感类型模型构建模块,用于根据通用的敏感数据定义,建立通用的敏感类型模型;
自定义敏感类型构建模块,用于自定义敏感类型,根据自定义的敏感类型建立自定义的敏感数据模型;
敏感数据匹配比率定义模块,用于定义并预设敏感数据匹配比率。
9.如权利要求8所述的一种敏感数据识别装置,其特征在于:所述敏感类型模型确定单元扫描欲进行敏感数据识别的数据库,提取所述数据库的库名、表名、表注释,针对各个表获取列名及列注释并进行判断,从而确定相应的敏感类型模模型。
10.如权利要求9所述的一种敏感数据识别装置,其特征在于:所述敏感数据识别单元进一步包括:
抽取模块,用于对所述数据库的每张表每列数据随机抽取预设数量数据;
数据匹配模块,根据所述敏感类型模型确定单元确定的敏感类型模型对抽取的当前列数据一一进行匹配,确定是否与所述敏感类型模型确定单元中确定的敏感类型模型匹配;
敏感类型确定模块,用于根据所述数据匹配模块的匹配结果与敏感类型模型构建单元定义的敏感数据匹配比率,确定当前列数据是否属于敏感类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海英方软件股份有限公司,未经上海英方软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110597331.8/1.html,转载请声明来源钻瓜专利网。