[发明专利]隐私保护k-means聚类方法、设备、介质、终端在审
申请号: | 202110823353.1 | 申请日: | 2021-07-21 |
公开(公告)号: | CN113626858A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 刘雪峰;张思君;雷静 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62 |
代理公司: | 西安长和专利代理有限公司 61227 | 代理人: | 何畏 |
地址: | 710071 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 隐私 保护 means 方法 设备 介质 终端 | ||
1.一种隐私保护k-means聚类方法,其特征在于,所述隐私保护k-means聚类方法包括:以下步骤:
步骤一,进行数据收集:数据拥有者即用户使用服务器S1的公钥pk1加密数据发送给服务器S0,同时使用服务器S0的公钥pk0加密数据发送给服务器S1;
步骤二,生成初始中心:服务器S0将所有密文数据初始化分类,并计算得到初始密文中心点;
步骤三,进行相似度测量:服务器S0将密文中心点信息发给服务器S1,服务器S1解密并利用同态技术计算得到各点到中心点的密文距离,并将密文距离发送给服务器S0;
步骤四,比较更新迭代:服务器S0解密并根据距离比较结果重新进行分类,得到新一轮的分类结果,重复步骤二至步骤三直至分类结果不再发生改变。
2.如权利要求1所述隐私保护k-means聚类方法,其特征在于,所述数据收集包括:
(1)进行初始化,服务器S0利用paillier算法生成公钥pk0以及对应私钥sk0,服务器S1生成公钥pk1和对应的私钥sk1;服务器S0与服务器S1将自己的公钥发送给各个用户;
(2)用户使用公钥pk1加密用户的隐私信息即向量Ei=(e1,e2,...,en)得到密文使用公钥pk0加密向量Ei=(e1,e2,...,en)得到密文
(3)用户将发送给服务器S0,将发送给服务器S1。
3.如权利要求2所述隐私保护k-means聚类方法,其特征在于,所述生成初始中心包括:
1)服务器S0将所有数据i∈{1,...,N},N表示用户的总数,按照初始的分类方法的分成K类,并记录下分类结果R0;
2)服务器S0根据本轮的分类结果R0,基于下式计算明文下各类的和向量的密文:
其中:表示第Cj类的所有向量相加的和向量;表示第Cj类的所有向量相加的和向量的第a维数据;表示第Cj类中的第i个用户信息向量;表示第Cj类中的第i个用户信息向量的第a维的数据,对于每一类而言,1≤i≤tj;∑表示累加符号;∏表示累乘符号;
3)服务器S0得到被公钥pk1加密后的各类明文数据的和向量的密文,再将其除以各类含有的用户向量的数量,得到初始中心点或者新一轮的中心点;服务器S0将密文下的中心点信息向量发送给服务器S1。
4.如权利要求3所述隐私保护k-means聚类方法,其特征在于,所述初始的分类方法包括:将第i个用户信息划分给第(i%K)+1类;
其中,(i%K)+1表示i除以K的余数再加上1;表示第j类的第一个用户向量;第j类记为并且记录下第j类的用户信息向量的个数tj;记录下分类结果R0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110823353.1/1.html,转载请声明来源钻瓜专利网。