[发明专利]动态数据聚类算法无效

专利信息
申请号: 201010290571.5 申请日: 2010-09-25
公开(公告)号: CN101957850A 公开(公告)日: 2011-01-26
发明(设计)人: 张仲非;金永波;杨名;祁仲昂;王跃 申请(专利权)人: 浙江大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 杭州宇信知识产权代理事务所(普通合伙) 33231 代理人: 张宇娟
地址: 310027 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 动态 数据 算法
【权利要求书】:

1.动态数据聚类算法,其特征在于包括如下步骤:

1)选择一个关系网络,对关系网络内的n个动态关系数据进行预处理,用带权值的无向图表征,边的权重代表网络中结点间相似程度,权重越大,相似性越大;

2)对一定连续时间内变化的动态关系网络数据,以相同的时间间隔采集T个时间点的离散数据来拟合连续时间数据,每个时间点数据表示为无向图的网络形式,然后将无向图以关系矩阵的形式表示;

3)对步骤2)中得到的关系矩阵进行分解,建立一种基于矩阵分解的全局代价函数,采用循环迭代加载更新代价函数,求得最优解,修正聚类结果。

2.如权利要求1所述的动态数据聚类算法,其特征在于步骤2)中采集T个时间点的离散数据来拟合连续时间数据,将每个时间点数据表示为无向图的网络形式,边的权重代表网络中结点间的相似程度,权重越大,相似性越大,然后将无向图以关系矩阵的形式来表示,得到一系列的关系矩阵序列A1,...,At,...AT,At代表t时刻的n×n关系矩阵,n是结点数目。

3.如权利要求1所述的动态数据聚类算法,其特征在于步骤3)中所述的全局代价函数包括现时数据代价函数和历史数据与现时关联信息产生的代价函数。

4.如权利要求2所述的动态数据聚类算法,其特征在于对某一t时刻的数据At利用矩阵分解的方法得到聚类矩阵:其中C1,...,Ct表示在相应时刻聚类后得到的类矩阵,Ct∈{0,1}n×k,∑jCi,j=1,k是总共的类数,Ci,j=1表示结点i经过聚类后成为第j类的元素,每个结点在每个时间点只能被隶属于一个类,即∑jCi,j=1,B1,...,Bt表示对应时刻的类间关系矩阵,Bi,j表示i类与j类的权重关系,分解的结果使原有数据不失真,即

5.如权利要求3或4所述的动态数据聚类算法,其特征在于所述的全局代价函数的建立方法如下:全局代价函数包含两部分,一部分为现时数据的聚类的代价函数,表示为Costsnapshot,另一部分为历史数据与现时关联信息产生的代价函数,表示为Costhistory

首先,考虑现时数据的聚类,Costsnapshot用来衡量每一时刻数据的聚类结果:

F1:Costsnapshot=minΣt=1T||At-At*||2=minΣt=1T||At-CtBt(Ct)T||2]]>

F1式得到的C1,...,CT和B1,...,BT要满足这样对原始数据进行分解后,可以利用分解结果恢复原始数据,保证了原始数据完整性;

然后,考虑历史数据与现时关联信息产生的代价,定义下式:

F2:Costhistory=minΣt=2T||CtCtT-Ct-1Ct-1T||2]]>

最后,建立全局代价函数:

F3:Costglobal=minΣt=1T||At-CtBtCtT||2-α×Σt=2T||CtCtT-Ct-1Ct-1T||2]]>

其中α为F1和F2之间权重,α越大,说明越多的权重用于匹配聚类结果的历史信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010290571.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top