[发明专利]基于区块链和同态加密的决策树模型训练方法及装置在审
申请号: | 202010833050.3 | 申请日: | 2020-08-18 |
公开(公告)号: | CN111966753A | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 张亚泽 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06F16/27 | 分类号: | G06F16/27;G06F21/64;G06F21/60;G06F21/62;G06K9/62 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 谷敬丽;周晓飞 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 区块 同态 加密 决策树 模型 训练 方法 装置 | ||
本发明公开了一种基于区块链和同态加密的决策树模型训练方法及装置,该方法应用于加入区块链网络的参与方节点,包括:获得用户特征,计算所述用户特征的信息增益;对所述用户特征的信息增益进行同态加密,获得用户特征的信息增益密文数据,将所述用户特征的信息增益密文数据生成区块,将所述区块上传到区块链网络;从区块链网络中下载所需的用户特征的信息增益密文数据进行决策树模型训练。本发明利用区块链技术实现用户特征数据共享,打破“数据孤岛”困境;通过同态加密后的用户特征的信息增益密文数据训练决策树模型,保证密文下模型训练结果保持不变。
技术领域
本发明涉及模型训练技术领域,尤其涉及基于区块链和同态加密的决策树模型训练方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着人工智能理论与技术的发展,利用大量的用户信息可以为用户提供定制化、个性化的符合用户偏好的服务。机器学习模型的准确率需要大量的训练数据以及丰富的用户特征作为支撑。然而,鉴于数据的安全以及用户数据的隐私保护,一方面,目前各个银行间的数据是不可能共享用于训练模型,使得数据分布在独立的“数据孤岛”中,从而导致模型训练时用户特征以及训练样本不够丰富;另一方面,现有的机器学习算法方案都是直接对用户的数据进行分析,不能对加密后的数据进行分析计算和模型训练,即直接基于用户明文数据进行分析和决策树模型训练,用户隐私无法得到保证。
发明内容
本发明实施例提供一种基于区块链和同态加密的决策树模型训练方法,用以解决现有技术中数据不能共享造成“数据孤岛”和不能对加密后的数据进行分析计算和模型训练导致用户隐私无法得到保证的技术问题,该方法应用于加入区块链网络的参与方节点,包括:
获得用户特征,计算所述用户特征的信息增益;
对所述用户特征的信息增益进行同态加密,获得用户特征的信息增益密文数据,将所述用户特征的信息增益密文数据生成区块,将所述区块上传到区块链网络;
从区块链网络中下载所需的用户特征的信息增益密文数据进行决策树模型训练。
本发明实施例提供一种基于区块链和同态加密的决策树模型训练方法,用以,该方法包括:
参与方节点获得用户特征,计算所述用户特征的信息增益;
参与方节点对所述用户特征的信息增益进行同态加密,获得用户特征的信息增益密文数据,将所述用户特征的信息增益密文数据生成区块,将所述区块上传到区块链网络;
区块链网络接收并存储所述区块;
参与方节点从区块链网络中下载所需的用户特征的信息增益密文数据进行决策树模型训练。
本发明实施例还提供一种基于区块链和同态加密的决策树模型训练装置,用以解决现有技术中数据不能共享造成“数据孤岛”和不能对加密后的数据进行分析计算和模型训练导致用户隐私无法得到保证的技术问题,该装置包括:
用户特征获得模块,应用获得用户特征;
信息增益计算模块,用于计算所述用户特征的信息增益;
同态加密模块,用于对所述用户特征的信息增益进行同态加密,获得用户特征的信息增益密文数据;
数据交互模块,用于将所述用户特征的信息增益密文数据生成区块,将所述区块上传到区块链网络;从区块链网络中下载所需的用户特征的信息增益密文数据;
模型训练模块,用于根据所需的用户特征的信息增益密文数据进行决策树模型训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010833050.3/2.html,转载请声明来源钻瓜专利网。