[发明专利]基于监督学习的食品数据多属性特征联合脱敏方法和装置有效
申请号: | 202010389535.8 | 申请日: | 2020-05-10 |
公开(公告)号: | CN111666587B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 李琳;储宇;袁景凌 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/906;G06Q10/083 |
代理公司: | 武汉蓝宝石专利代理事务所(特殊普通合伙) 42242 | 代理人: | 谢洋 |
地址: | 430000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 学习 食品 数据 属性 特征 联合 方法 装置 | ||
1.一种基于监督学习的食品数据多属性特征联合脱敏方法,其特征在于,包括:
S1,获取食品数据样本进行分类和预处理,获得样本敏感数据;
S2,对样本敏感数据添加脱敏算法标签;
S3,基于添加脱敏算法标签后的样本敏感数据,构建敏感信息数据库;
S4,获取待脱敏数据进行预处理;
S5,将预处理后的待脱敏数据与敏感信息数据库中的数据进行多属性特征匹配,根据多任务学习方法获得待脱敏数据中每一敏感属性对应的脱敏算法标签;
S6,将待脱敏数据的不同敏感属性根据各自对应的脱敏算法标签进行脱敏,得到脱敏后的数据;
所述S1具体包括:
S11,对食品数据样本中的结构化数据和非结构化数据分别进行分类整理;
S12,对所述结构化数据中的关键字段进行特征提取,对所述非结构化数据中的关键属性进行特征提取;
所述S5具体包括:
S51,将所述待脱敏数据结构化数据中的关键字段以及待脱敏数据非结构化数据中的关键属性,分别与敏感信息数据库中的敏感数据进行特征匹配;
S52,通过匹配特征值,对待脱敏数据的不同敏感属性进行多任务监督学习,联合学习每一敏感属性对应的脱敏方法标签。
2.根据权利要求1所述的基于监督学习的食品数据多属性特征联合脱敏方法,其特征在于,所述S2中具体包括:
S21,对预处理后获得的样本敏感数据进行分析,选取样本敏感数据中不同敏感属性适宜的脱敏算法;
S22,将选取的不同敏感属性适宜的脱敏算法作为标签添加到所述样本敏感数据上。
3.根据权利要求1所述的基于监督学习的食品数据多属性特征联合脱敏方法,其特征在于,S4中,所述获取待脱敏数据进行预处理具体包括:
获取食品产生及运输过程中产生的待脱敏数据进行预处理,提取待脱敏数据结构化数据中的关键字段以及待脱敏数据非结构化数据中的关键属性。
4.根据权利要求1所述的基于监督学习的食品数据多属性特征联合脱敏方法,其特征在于,在步骤S6之后,所述方法还包括:
S7,将所述脱敏后的数据添加脱敏算法标签,并加入到敏感信息数据库中。
5.一种基于监督学习的食品数据多属性特征联合脱敏装置,其特征在于,包括:样本预处理模块,用于获取食品数据样本进行分类和预处理,获得样本敏感数据;脱敏算法标签添加模块,用于对样本敏感数据添加脱敏算法标签;
敏感信息数据库构建模块,用于基于添加脱敏算法标签后的样本敏感数据,构建敏感信息数据库;
待脱敏数据预处理模块,用于获取待脱敏数据进行预处理;
多任务学习模块,用于将预处理后的待脱敏数据与敏感信息数据库中的数据进行多属性特征匹配,根据多任务学习方法获得待脱敏数据中每一敏感属性对应的脱敏算法标签;
数据脱敏模块,用于将待脱敏数据的不同敏感属性根据各自对应的脱敏算法标签进行脱敏,得到脱敏后的数据;
所述用于获取食品数据样本进行分类和预处理,获得样本敏感数据具体包括:对食品数据样本中的结构化数据和非结构化数据分别进行分类整理;对所述结构化数据中的关键字段进行特征提取,对所述非结构化数据中的关键属性进行特征提取;
所述用于将预处理后的待脱敏数据与敏感信息数据库中的数据进行多属性特征匹配,根据多任务学习方法获得待脱敏数据中每一敏感属性对应的脱敏算法标签具体包括:
将所述待脱敏数据结构化数据中的关键字段以及待脱敏数据非结构化数据中的关键属性,分别与敏感信息数据库中的敏感数据进行特征匹配;
通过匹配特征值,对待脱敏数据的不同敏感属性进行多任务监督学习,联合学习每一敏感属性对应的脱敏方法标签。
6.根据权利要求5所述的基于监督学习的食品数据多属性特征联合脱敏方法,其特征在于,还包括:
数据库扩充模块,用于将所述脱敏后的数据添加脱敏算法标签,并加入到敏感信息数据库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010389535.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种豆腐块自动分割设备
- 下一篇:基于双区块链的产品溯源方法及系统