[发明专利]一种安全的数据外包机器学习数据分析方法有效
| 申请号: | 201710224720.X | 申请日: | 2017-04-07 |
| 公开(公告)号: | CN107124276B | 公开(公告)日: | 2020-07-28 |
| 发明(设计)人: | 赵姝畅;骆苑新雨;郭娟娟;马建峰;王祥宇;常益嘉;马莹莹 | 申请(专利权)人: | 西安电子科技大学 |
| 主分类号: | H04L9/30 | 分类号: | H04L9/30;H04L9/00;H04L29/06;G06N20/00;G06F21/60 |
| 代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
| 地址: | 710065 陕*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 安全 数据 外包 机器 学习 分析 方法 | ||
本发明公开了一种安全的数据外包机器学习数据分析方法,由任意树均能化归为二叉树的性质,将训练好的决策树预测模型化归为二叉树,并归纳为一个形为无穷多个乘数项之和的特殊多项式,对模型中每一个数据用RSA加密上传到云平台,再将需要被决策的数据也用RSA加密上传到云平台,利用RSA的乘同态加密性质,将模型的加密数据和需要被决策的加密数据进行相应计算,得到每一个乘数项的密文结果,将结果返回到数据使用者解密,即可得到决策结果,通过将二叉树转化为多项式,使得原本需要多种计算才能实现的决策树,转化为一种计算即可实现,进而使用乘同态算法就能快速完成决策树的机器学习过程,大大降低了在密文上进行决策树这种机器学习算法的复杂程度,提升了计算效率。
技术领域
本发明属于信息安全技术领域,具体涉及一种安全的数据外包机器学习数据分析方法。
背景技术
随着科技的发展,云平台(Cloud Platforms)的规模巨大、虚拟快捷、通用性强、按需服务并且非常廉价等优越性日益凸显,这使得大数据的高速运算和高效存储成为现实。但一直以来,云平台都存在着巨大的安全隐患,极易出现数据泄露事件。短短几年内,触目惊心的信息泄露事件频出:美国第二大医疗保险公司Anthem丢失8000万个人信息、国内知名求职平台 58同城简历数据被廉价售卖等等;数据泄露的根本原因是,用户的个人隐私数据集中储存在云平台的服务器上,这些隐私数据对于云平台完全透明,用户无法对数据的流向和应用进行监管,直接导致无论是云平台遭受外部攻击抑或内部人员非法泄露数据,都会直接造成大量隐私数据泄露的事件发生。这不仅威胁着所有使用者的个人隐私和生命财产安全,也严重打击了公众对云平台的信心,阻碍了云平台的推广应用,限制了云平台的应用场景。
为了防止数据泄露事件的发生,对数据加密后再存储在云平台上是公认最有效的方法,但这带来了一个新的问题:加密后的密文毫无特征,云平台无法对其进行有效处理,丧失了它在大数据处理方面的优势,而一旦将数据解密又极易造成隐私数据泄露,甚至带来严重的灾难性后果。为了解决这类问题,同态加密的思想在20世纪70年代被首次提出,并于近些年取得了突破性进展。同态加密能实现密文之间的计算以达到处理明文的目的,即对密文计算出结果后解密等价于先解密成明文后再对明文计算出结果,这种特性对密文运算有着重要意义,其中全同态加密指可对密文进行任意计算,半同态加密是指可对密文进行一种或几种计算,可对密文进行乘法运算的同态加密算法又叫乘同态加密算法。全同态加密功能强大,但是其存取耗时过长,处理复杂度过高,严重拉低了云平台的工作效率,因此大规模的应用前景并不为人看好。相比之下,半同态加密算法不仅可满足基本的数据处理需求,处理速度也达到了可接受的程度,显然是一种更好的选择。在目前机器学习快速发展的背景下,基于半同态加密利用机器学习从密文数据中挖掘有效信息,促成更强的决策能力,可将云平台的优势发挥到极致,但是机器学习所要进行的计算较为复杂,难以用一种计算来实现。
发明内容
针对上述现有技术的不足,本发明的目的是提供一种安全的数据外包机器学习数据分析方法,解决了现有云平台上数据的安全性和可处理性间的矛盾,即数据加密后上传云平台无法对其进行处理,但解密后处理又将使数据面临泄露风险的问题。本发明基于决策树实现了对加密数据进行预测,可高效地对用户上传至云平台的加密数据进行方案决策、统计分析等处理,在保护隐私的同时增加了数据的利用率,可在一些处理大量隐私数据的特殊场所,例如医院、银行等进行广泛应用。
为了实现上述目的,本发明采用的技术方案是,一种安全的数据外包机器学习数据分析方法,包括以下步骤:
步骤一、模型提供者对训练集中数据进行训练构筑一个决策树,然后将决策树转化为二叉树,并将二叉树归为多项式:
其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710224720.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于GHZ态的动态串行密钥分发方法
- 下一篇:擦除终端数据的方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





