[发明专利]一种基于安全多方计算的卡方分箱方法有效

申请号：	202110999974.5	申请日：	2021-08-27
公开（公告）号：	CN113688354B	公开（公告）日：	2023-06-09
发明（设计）人：	何道敬;孙黎彤;杜润萌;张民;张熙;廖清	申请（专利权）人：	华东师范大学
主分类号：	G06F17/18	分类号：	G06F17/18;G06F21/60;G06F21/62;G06N20/20
代理公司：	上海蓝迪专利商标事务所(普通合伙) 31215	代理人：	徐筱梅;张翔
地址：	200241 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于安全多方计算卡方分箱方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于安全多方计算的卡方分箱方法，其特征在于，包括下述步骤：

步骤1：数据提供方通过同态加密系统生成一对公钥pk和私钥sk，将特征数据X＝{x₀,x₁,...,x_n-1},id∈[0,n-1]进行分组，将特征数据X中类别相同的数据的id划分为一个区间，共记作s个分组，记作x_t,t∈[0,s-1]，n,s为正整数，并且标记真实分组x_t的类别为1，使用公钥pk将该分组类别加密，记作E_x＝E(1)，得到真实分组信息Group_t(x_t,E_x)；

步骤2：构造虚假分组，将特征数据X的id随机划分s个分组区间，分组区间数目与真实分组个数保持一致，将区间记作x_v,v∈[0,s-1]，并且标记虚假分组的类别0，使用公钥pk将分组类别加密记作E_x＝E(0)，得到虚假分组信息为Group_v(x_v,E_x)；

步骤3：将真实分组信息和虚假分组信息按行连接，并且按行乱序，得到分组信息Group_X，数据提供方将分组信息Group_X(x_i,E_x)发送给数据应用方；

步骤4：数据应用方将分组信息Group_X(x_i,E_x)与标签数据Y＝{y₀,y₁,...,y_i,...,y_n-1},id∈[0,n-1]的id映射，得出每个分组区间x_i对应的标签数据y_i的值，将每个分组区间x_i对应的标签数据y_i的值相加，得出该分组区间内响应样本个数Group_y，根据该分组区间内数据总数Group_s，计算得出该分组区间未响应样本的个数Group_n＝Group_s-Group_y，并且将所有分组区间的响应样本个数Group_y，未响应样本个数Group_n，样本总数Group_s，以及分组区间对应的分组类别标记E_x发送给数据提供方；

步骤5：数据提供方使用私钥将分组类别标记E_x解密，得到解密后分组类别标记D_x，其中D_x＝1则为真实分组，D_x＝0则为虚假分组，删除虚假分组信息；

步骤6：数据提供方根据真实分组区间对应的响应样本个数Group_y，未响应样本个数Group_n，样本总数Group_s，计算第i,i∈[0,2s-1]个分组第j个类别的期望样本个数E_ij，此处j∈[0,2)表示响应样本和未响应样本两类；根据相邻两个真实分组的期望样本个数E_ij，相邻两个真实分组的样本个数A_ij，计算得出相邻两个真实分组的卡方值χ²；

步骤7：数据提供方设置分箱数目限制，根据相邻分组的卡方值，卡方值最小的两个分组合并，合并后重新计算相邻分组的卡方值，直到分箱数目达到分箱数目限制后停止合并，得出卡方分箱结果。

2.根据权利要求1所述的一种基于安全多方计算的卡方分箱方法，其特征在于，步骤1所述真实分组x_t，其中只包括特征数据的id,id∈[0,n-1]，不包含特征数据的实际值，避免特征数据的实际值泄露。

3.根据权利要求1所述的一种基于安全多方计算的卡方分箱方法，其特征在于，步骤2所述将特征数据X的id随机划分s个分组区间，目的是构造虚假分组，将虚假分组混入真实分组中，保护真实分组信息。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华东师范大学，未经华东师范大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110999974.5/1.html，转载请声明来源钻瓜专利网。

上一篇：一种细粒级高硅低铁锌精矿沸腾炉焙烧处理方法
下一篇：一种快速插拔的混合集成电源模块

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于安全多方计算的卡方分箱方法有效

专利文献下载