[发明专利]一种基于数据安全的混合聚类方法有效
申请号: | 201710312188.7 | 申请日: | 2017-05-05 |
公开(公告)号: | CN107122803B | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | 孙丽萍;陶涛;郭良敏;陈付龙;罗永龙 | 申请(专利权)人: | 安徽师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 34107 芜湖安汇知识产权代理有限公司 | 代理人: | 钟雪;马荣<国际申请>=<国际公布>=< |
地址: | 241000 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 安全 混合 方法 | ||
本发明适用于数据挖掘技术领域,提供了一种基于数据安全的混合聚类方法,该方法包括如下步骤:采用结合线性变换的旋转扰动方法对初始矩阵进行扰动;利用密度峰聚类算法构造初始质心解空间;利用万有引力搜索算法迭代完成数据点的聚类。本发明实施例采用结合线性变换的旋转扰动方法对初始矩阵进行扰动,保证聚类的相似性度量函数不变,同时对原始数据进行了数据隐私处理,之后利用密度峰聚类算法根据各数据点密度特性选取质心的方法构造初始质心解空间,最后使用万有引力搜索方法将扰动后的数据依据相似性度量函数进行聚类,直至所有数据对象完成聚类,且测评聚类质量的总均方量化误差最小,从而实现数据的最优聚类,保证数据效用且隐藏数据隐私。
技术领域
本发明属于数据安全、隐私保护及数据挖掘技术领域,尤其涉及一种基于数据安全的混合聚类方法。
背景技术
基于互联网的迅速发展,复杂网络已经成为人类社会中社会关系维系和信息传播的重要渠道和载体,在用户数量日益壮大的同时,数据量也以指数型暴涨,此时,数据挖掘技术发挥出不可替代的作用,通过对基于互联网的服务过程产生的数据进行挖掘研究,对分析复杂网络数据的拓扑结构、理解网络功能、发现数据中隐藏的规律、挖掘其中隐含的关联信息等方面有着十分重要的理论意义。
基于数据挖掘在海量数据中提取隐藏信息的强大能力,挖掘数据过程中产生的安全问题越来越受到社会各界的关注,比如通过关联规则分析可以从公开的属性结构信息获取一些隐藏信息从而实现商业化目的,通过数据库分析技术可以从海量数据中提取未知模式。由于以互联网为载体的服务具有特定的属性结构信息,并且其参与主体比较特殊,所以在数据共享和数据挖掘过程带来最直接也最主要的问题就是个人隐私泄漏问题。
现存许多数据保护方法无法兼顾数据效用以及隐私保护度的平衡,通常以牺牲隐私保护度来提高数据效用,造成数据隐私保护度低。
发明内容
本发明实施例提供一种基于数据安全的混合聚类方法,旨在解决现有的数据保护方法无法兼顾数据效用以及隐私保护度的平衡,通常以牺牲隐私保护度来提高数据效用,造成数据隐私保护度低的问题。
本发明实施例提供了一种基于数据安全的混合聚类方法,该方法包括如下步骤:
S1、采用结合线性变换的旋转扰动方法对初始矩阵进行扰动;
S2、利用密度峰聚类算法构造初始质心解空间;
S3、利用万有引力搜索算法迭代完成数据点的聚类。
本发明实施例通过采用结合线性变换的旋转扰动方法对初始矩阵进行扰动,保证聚类的相似性度量函数不变的同时,对原始数据进行了数据隐私处理,之后利用密度峰聚类算法根据各数据点密度特性选取质心的方法构造初始质心解空间,最后使用万有引力搜索方法在解空间强而稳定的搜索能力,将扰动后的数据依据相似性度量函数进行聚类,直至所有数据对象完成聚类,且测评聚类质量的总均方量化误差最小,从而实现数据的最优聚类,保证数据效用且又隐藏数据隐私。
附图说明
图1为本发明实施例提供的基于数据安全的混合聚类方法的流程图;
图2为本发明实施例提供的采用结合线性变换的旋转扰动方法的流程图;
图3为本发明实施例提供的利用密度峰聚类算法构造质心解空间的流程图;
图4为本发明是实体提供的利用万有引力搜索算法迭代完成数据点的聚类的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1为本发明实施例提供的基于数据安全的混合聚类方法的流程图,该方法包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽师范大学,未经安徽师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710312188.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置