[发明专利]动态数据聚类算法无效
申请号: | 201010290571.5 | 申请日: | 2010-09-25 |
公开(公告)号: | CN101957850A | 公开(公告)日: | 2011-01-26 |
发明(设计)人: | 张仲非;金永波;杨名;祁仲昂;王跃 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州宇信知识产权代理事务所(普通合伙) 33231 | 代理人: | 张宇娟 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 动态 数据 算法 | ||
技术领域
本发明属于信息数据处理的技术领域,具体涉及一种对动态关系数据进行聚类的动态数据聚类算法。
背景技术
随着信息时代的到来,数据已经实现了爆炸性的增长。得益于信息技术和数据库技术的迅猛发展,同时海量数据中也充满了各种关系信息,比如Internet、社会关系网、通信网以及市场客户间购买模式等等。我们如何应用现有的技术和工具来有效地管理、检索和分析这些关系数据是一个令人关注的问题。
关系数据聚类作为数据挖掘中一种数据分析技术,同时也是一种重要的人类行为。早在我们的儿童时代,我们就通过不断改进意识中的聚类模式来学会如何区分现实中的关系事物。目前,关系数据聚类分析已经广泛应用到各种领域,包括模式识别、图像处理、统计分析,以及市场研究。通过聚类,我们能够识别密集和稀疏的区域,因而发现全局的分布模式,以及数据属性之间的有趣的相互关系。在医学上,聚类可以根据病人的症状及指标对病人进行分类。在商务上,聚类能够帮助市场分析人员依据客户特有的购买模式和客户间的关系信息对客户数据库中客户群进行有效地划分。在生物上,聚类通过蛋白质分子结构或者基因片段的分析,来寻找相似结构的单元。同时随着互联网的普及,我们习惯于在互联网上搜索信息和与人交流。聚类分析也可以用于互联网数据的分析,用户在网站上的行为反映了他们的兴趣和需求,如果对用户的行为加以分析,就有可能发现一些潜在的规律。了解用户的访问模式和兴趣爱好,对用户进行一定的群分,有助于优化网站的组织结构和空间设计。
同时,现实中很多的海量关系数据其实是动态的关系数据。数据中的内在关系会随着时间的变化而变化。当前关系数据的结构信息又往往受影响于历史数据的结构信息。因此,在聚类分析动态关系数据时,仅仅使用静态的算法来分析当前时刻的数据会丢失数据的时变性。在未考虑历史信息的前提下,当前时刻数据的聚类结果并不能准确地反映动态数据的变化规律,自然也没法准确挖掘数据中隐含的模式和知识。只有应用动态算法来处理动态关系数据才能准确挖掘数据的模式和知识,同时也能预测数据未来时刻的发展趋势。因此,动态关系数据的聚类分析已经成为当前数据挖掘领域一个非常活跃的研究方向。
发明内容
针对现有技术中存在的问题,本发明的目的在于提供一种动态数据聚类算法的技术方案,对动态关系数据进行聚类分析,并根据分析结果揭示数据个体未来时刻的发展趋势。
所述的动态数据聚类算法,其特征在于包括如下步骤:
1)选择一个关系网络,对关系网络内的n个动态关系数据进行预处理,用带权值的无向图表征,边的权重代表网络中结点间相似程度,权重越大,相似性越大;
2)对一定连续时间内变化的动态关系网络数据,以相同的时间间隔采集T个时间点的离散数据来拟合连续时间数据,每个时间点数据表示为无向图的网络形式,然后将无向图以关系矩阵的形式表示;
3)对步骤2)中得到的关系矩阵进行分解,建立一种基于矩阵分解的全局代价函数,采用循环迭代加载更新代价函数,求得最优解,修正聚类结果。
所述的动态数据聚类算法,其特征在于步骤2)中采集T个时间点的离散数据来拟合连续时间数据,将每个时间点数据表示为无向图的网络形式,边的权重代表网络中结点间的相似程度,权重越大,相似性越大,然后将无向图以关系矩阵的形式来表示,得到一系列的关系矩阵序列A1,...,At,...AT,At代表t时刻的n×n关系矩阵,n是结点数目。
所述的动态数据聚类算法,其特征在于步骤3)中所述的全局代价函数包括现时数据代价函数和历史数据与现时关联信息产生的代价函数。所述的动态数据聚类算法,其特征在于对某一t时刻的数据At利用矩阵分解的方法得到聚类矩阵:其中C1,...,Ct表示在相应时刻聚类后得到的类矩阵,Ct∈{0,1}n×k,∑jCi,j=1,k是总共的类数,Ci,j=1表示结点i经过聚类后成为第j类的元素,每个结点在每个时间点只能被隶属于一个类,即∑jCi,j=1,B1,...,Bt表示对应时刻的类间关系矩阵,Bi,j表示i类与j类的权重关系,分解的结果使原有数据不失真,即
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010290571.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:智能建筑集成系统
- 下一篇:液晶显示面板、像素阵列基板及其像素结构
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置