[发明专利]基于监督学习的食品数据多属性特征联合脱敏方法和装置有效
申请号: | 202010389535.8 | 申请日: | 2020-05-10 |
公开(公告)号: | CN111666587B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 李琳;储宇;袁景凌 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/906;G06Q10/083 |
代理公司: | 武汉蓝宝石专利代理事务所(特殊普通合伙) 42242 | 代理人: | 谢洋 |
地址: | 430000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 学习 食品 数据 属性 特征 联合 方法 装置 | ||
本发明实施例提供一种基于监督学习的食品数据多属性特征联合脱敏方法和装置,方法包括:获取食品数据样本进行分类和预处理,获得样本敏感数据;对样本敏感数据添加脱敏算法标签,构建敏感信息数据库;将预处理后的待脱敏数据与敏感信息数据库中的数据进行多属性特征匹配,根据多任务学习方法获得待脱敏数据中每一敏感属性对应的脱敏算法标签。本发明将监督学习、多任务学习方法运用到食品结构化数据和非结构化数据的脱敏技术上,从而针对多类型的食品数据能快速地识别敏感数据并找到适宜的脱敏算法。将脱敏后数据加入到敏感信息数据库,为之后待脱敏数据的数据脱敏提供参考。
技术领域
本发明实施例涉及数据脱敏领域,尤其涉及一种基于监督学习的食品数据多属性特征联合脱敏方法和装置。
背景技术
随着国家经济水平的提高和经济全球化的深入发展,消费者对商品品质有了更高的追求,“民以食为天,食以安为先”的安全消费意识逐渐深入人心。食品在生产及运输过程中可能会产生敏感信息,例如在食品生产时企业所用到的独特配方信息,在食品加工时用到的加工技术,在食品运输过程中用到的保鲜或冷冻方法等,都属于相关企业或公司不想对外公开的敏感信息。为了保障数据的隐私性和安全性,需要有效地保护食品数据的敏感属性,满足食品安全数据脱敏指标要求。
传统的针对食品数据的脱敏技术(如k-匿名、数据扰动、差分隐私保护等)着重于最后呈现的结果,缺少对食品多样化,运输过程多样化的预判,面对海量的食品数据识别精度不够,需要进行人工干预和不定期配置。同时,由于食品的多样性,导致传统的数据脱敏技术分类分级智能化不足以及在不同运输条件下的灵活度不足。传统的数据脱敏技术面对食品数据的多样性,无法针对性的给出脱敏方法。
发明内容
本发明实施例提供一种基于监督学习的食品数据多属性特征联合脱敏方法和装置,用以解决传统数据脱敏技术面对食品数据的多样性无法针对性的给出脱敏方法的缺陷。
第一方面,本发明实施例提供一种基于监督学习的食品数据多属性特征联合脱敏方法,包括:
S1,获取食品数据样本进行分类和预处理,获得样本敏感数据;
S2,对样本敏感数据添加脱敏算法标签;
S3,基于添加脱敏算法标签后的样本敏感数据,构建敏感信息数据库;
S4,获取待脱敏数据进行预处理;
S5,将预处理后的待脱敏数据与敏感信息数据库中的数据进行多属性特征匹配,根据多任务学习方法获得待脱敏数据中每一敏感属性对应的脱敏算法标签;
S6,将待脱敏数据的不同敏感属性根据各自对应的脱敏算法标签进行脱敏,得到脱敏后的数据。
进一步,所述S1具体包括:
S11,对食品数据样本中的结构化数据和非结构化数据分别进行分类整理;
S12,对所述结构化数据中的关键字段进行特征提取,对所述非结构化数据中的关键属性进行特征提取。
进一步,所述S2中具体包括:
S21,对预处理后获得的样本敏感数据进行分析,选取样本敏感数据中不同敏感属性适宜的脱敏算法。
S22,将选取的不同敏感属性适宜的脱敏算法作为标签添加到所述样本敏感数据上。
进一步,S4中,所述获取待脱敏数据进行预处理具体包括:
获取食品产生及运输过程中产生的待脱敏数据进行预处理,提取待脱敏数据结构化数据中的关键字段以及待脱敏数据非结构化数据中的关键属性。
进一步,所述S5具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010389535.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种豆腐块自动分割设备
- 下一篇:基于双区块链的产品溯源方法及系统