[发明专利]特征分箱方法、装置、设备及计算机可读存储介质有效
| 申请号: | 202010296447.3 | 申请日: | 2020-04-15 |
| 公开(公告)号: | CN111506485B | 公开(公告)日: | 2021-07-27 |
| 发明(设计)人: | 谭明超;范涛;马国强;陈天健;杨强 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
| 主分类号: | G06F11/34 | 分类号: | G06F11/34;G06F21/62;G06F21/60;G06N20/00 |
| 代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 许峰 |
| 地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 特征 方法 装置 设备 计算机 可读 存储 介质 | ||
本发明公开了一种特征分箱方法、装置、设备及计算机可读存储介质,所述方法包括:接收各所述第二终端发送的待分箱特征的备选分位点,其中,各所述第二终端基于各自的特征数据求取得到各自的所述备选分位点;基于各所述备选分位点确定所述待分箱特征的最终分位点。本发明实现在数据分布在多方,需要多方联合进行特征分箱的场景下,能够在保护数据隐私的情况下完成联合特征分箱,提升了数据安全性,适应于对数据隐私要求严格的应用场景。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种特征分箱方法、装置、设备及计算机可读存储介质。
背景技术
随着计算机技术的发展,越来越多的技术(大数据、分布式、区块链Blockchain、人工智能等)应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出了更高的要求。
目前,在很多领域需要对特征进行分箱,例如,在机器学习中,特征分箱并基于分箱结果求变量的显著性等过程往往是特征工程的重要方法,比如,要考察特征与标签之间的相关程度时,iv(Information Value,信息价值)值往往是变量显著性的重要指标,可运用于特征选择之中。
但是,目前,当待分箱特征的特征数据分布存放在多方,需要联合多方进行特征分箱时,各方采用互相发送特征数据的方式来进行联合特征分箱,这种方式会互相暴露各自的数据,若需要对各方的数据进行隐私保护,则无法联合各方进行特征分箱。
发明内容
本发明的主要目的在于提供一种特征分箱方法、装置、设备及计算机可读存储介质,旨在目前联合多方进行特征分箱的方式会暴露各自的数据,无法做到隐私保护的问题。
为实现上述目的,本发明提供一种特征分箱方法,所述特征分箱方法应用于第一终端,所述第一终端与第二终端通信连接,所述特征分箱方法包括以下步骤:
接收各所述第二终端发送的待分箱特征的备选分位点,其中,各所述第二终端基于各自的特征数据求取得到各自的所述备选分位点;
基于各所述备选分位点确定所述待分箱特征的最终分位点。
进一步地,所述基于各所述备选分位点确定所述待分箱特征的最终分位点的步骤包括:
检测各所述备选分位点是否满足预设的数据分布平衡条件;
若各所述备选分位点满足所述数据分布平衡条件,则从各所述备选分位点中选择一个备选分位点作为所述待分箱特征的最终分位点。
进一步地,所述检测各所述备选分位点是否满足预设的数据分布平衡条件的步骤包括:
从各所述备选分位点中确定最大值和最小值;
检测所述最大值与所述最小值的差值是否小于预设阈值,以检测各所述备选分位点是否满足预设的数据分布平衡条件;
所述若各所述备选分位点满足所述数据分布平衡条件,则从各所述备选分位点中确定一个备选分位点作为所述待分箱特征的最终分位点的步骤包括:
若所述差值小于所述预设阈值,则确定各所述备选分位点满足所述数据分布平衡条件,并将所述最大值或所述最小值作为所述待分箱特征的最终分位点。
进一步地,所述检测所述最大值与所述最小值的差值是否小于预设阈值的步骤之后,还包括:
若所述差值大于或等于所述预设阈值,则确定各所述备选分位点不满足所述数据分布平衡条件,并将所述最大值和所述最小值发送给各所述第二终端,以供各所述第二终端确定所述最大值和所述最小值所限定的数值区间,并基于各自特征数据中处于所述数值区间的特征数据求取得到各自新的备选分位点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010296447.3/2.html,转载请声明来源钻瓜专利网。





