[发明专利]一种基于大数据的隐私数据分级保护方法在审
申请号: | 202011018209.2 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112100670A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 周丽君 | 申请(专利权)人: | 周丽君 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F21/60;G06F16/245 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610213 四川省成都市天府新区牧*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 隐私 分级 保护 方法 | ||
1.一种基于大数据的隐私数据分级保护方法,其特征在于:包括以下步骤:
1)获取关键词,设定隐私程度等级;将获取的关键词按照隐私程度分为不同的等级,每个隐私程度等级下有若干个关键词,为每一个关键词建立一个存储目录;
2)选取其中一个隐私程度等级内的其中一个关键词对数据库进行检索,将使用此关键词搜索到的数据归类到此关键词的存储目录下;
3)重复步骤2)的操作,直至遍历步骤2)选取隐私程度等级内的全部关键词;
4)重复步骤2)至步骤3)的操作,直至遍历全部隐私程度等级;
5)对隐私程度等级高的关键词的存储目录内存储的数据进行加密。
2.根据权利要求1所述的基于大数据的隐私数据分级保护方法,其特征在于:在步骤1)中,获取关键词的方法为:搜索数据库内待处理的隐私数据,提取数据库内待处理的隐私数据中的高频词,将提取的高频词作为高频词集合。
3.根据权利要求2所述的基于大数据的隐私数据分级保护方法,其特征在于:在步骤1)中,将获取的关键词按照隐私程度分为不同的等级的步骤包括:
1-1)遍历高频词集合中的全部高频词,计算高频词集合中任意两个高频词之间的相似度;
1-2)设置相似度阈值,将相似度处于相似度阈值内的两个高频词归于同一个关键词内,以此获得全部关键词;
1-3)通过数据库服务器获取外部服务器访问每个关键词的访问频次;
1-4)依据关键词的访问频次,计算包含此关键词的数据的访问信任度;
1-5)计算步骤1-2)获得的全部关键词中任意两个关键词之间的相似度,建立邻近关系矩阵;
1-6)通过关键词邻近关系矩阵,得到关键词在邻近关系矩阵内受到相邻关键词的影响关系,获得关键词在邻近关系矩阵内的特征向量;
1-7)建立关键词的敏感度查询函数,计算关键词的敏感度值;
1-8)以关键词的敏感度值为标准,判断关键词的隐私度,并将全部关键词分为不同的隐私等级。
4.根据权利要求3所述的基于大数据的隐私数据分级保护方法,其特征在于:在步骤1-1)中,计算高频词集合中任意两个高频词之间的相似度时,包括以下步骤:
1-1-1)分别找出两个高频词所在的数据;
1-1-2)计算两个高频词在其所在数据中的词频,分别生成两个高频词所在的数据的词频向量;
1-1-3)计算两个高频词的词频向量的余弦相似度;
在步骤1-2)中,将步骤1-1-3)中计算的高频词的词频向量的余弦相似度数值作为两个高频词的相似度。
5.根据权利要求3所述的基于大数据的隐私数据分级保护方法,其特征在于:步骤1-4)中,依据关键词的访问频次,计算包含此关键词的数据的访问信任度;将访问信任度表示为:αFu,i+1>0是一个关于Fu,i的单调递增函数,Fu,i为关键词i的被访问频次,Wu,i为关键词i的访问信任度。
6.根据权利要求3所述的基于大数据的隐私数据分级保护方法,其特征在于:步骤1-5)中,步骤1-2)获得的全部关键词中任意两个关键词之间的相似度的过程包括:
找到包含这两个关键词的数据,计算这两个关键词在包含这两个关键词的数据中的词频,分别生成包含这两个关键词的数据的词频向量;
计算包含这两个关键词的数据的词频向量的余弦相似度,以包含这两个关键词的数据的词频向量的余弦相似度作为这两个关键词的相似度;
以上述步骤计算出的关键词的相似度为基础,以相似度高的两个关键词为两个相邻元,建立邻近关系矩阵。
7.根据权利要求6所述的基于大数据的隐私数据分级保护方法,其特征在于:在步骤1-6)中,关键词在邻近关系矩阵内的特征向量表示为:其中,是邻近关系矩阵内所有关键词的相似度的归一化值,L(i)表示关系矩阵内关键词i相邻的关键词的集合,sim(i,j)表示关键词i和关键词j的相似度,表示关键词i的特征向量。
8.根据权利要求6所述的基于大数据的隐私数据分级保护方法,其特征在于:步骤1-7)中,敏感度查询函数表示为:其中,为关键词i的第n个高频词的敏感度函数,关键词i为包括n个高频词的数集,n和n-1为关键词i中的两个高频词,f(n)为高频词n想关于关键词i的一个单调递增函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于周丽君,未经周丽君许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011018209.2/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置