[发明专利]动态异质网络演化聚类分析方法在审
| 申请号: | 201811270756.2 | 申请日: | 2018-10-29 |
| 公开(公告)号: | CN109543033A | 公开(公告)日: | 2019-03-29 |
| 发明(设计)人: | 戴维迪;李胜男 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/332 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程小艳 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 异质网络 聚类 领域研究 分析 网络 研究 聚类分析 聚类结果 领域知识 期刊数据 数据字段 演化趋势 异构网络 意义词 构建 字段 合并 发现 | ||
本发明公开一种动态异质网络演化聚类方法,主要步骤有,首先研究数据的数据及处理:具体为确定所需研究领域,获取期刊数据;提取研究字段;对获取得数据字段进行提取研究主题,消除无意义词以及常用词。其次是动态异质网络演化聚类。本发明构建动态异质网络的演化聚类框架,旨在对异构网络进行演化分析。通过对其进行分析,得到不同时刻的书目网络的聚类结果,从而可以分析不同类型实体之间的演化趋势,发现网络的出现、消失、合并、分离等演化行为。最后结合现有领域知识,分析网络演化原因与未来发展趋势。通过对书目网络进行全面的分析,可以为领域研究提供有价值的信息,指导未来领域研究发展。
技术领域
本发明属于复杂网络领域,具体涉及一种动态异质网络演化聚类分析方法。
背景技术
近年来,随着诸如社交网络、生物网络、书目网络等网络规模的不断扩大,研究人员从不同的角度对这些网络进行研究。这些网络有共同的属性,即它们包含不同类型的实体。与广泛研究的同构信息网络相比,异构网络包含了全面的结构信息和丰富的语义信息,为数据挖掘任务提供了新的机遇。与传统的聚类方法不同,动态异构信息网络考虑了不同对象的类型,对不同类型节点进行聚类分析,并分析其演化行为,使得分析结果更具有一般性。
发明内容
本发明的目的在于克服现有技术的不足,提供一种动态异质网络演化聚类方法。
本发明为解决上述背景技术中提出的技术问题,采用的技术方案是:动态异质网络演化聚类方法,该方法包括如下步骤:
S1:研究数据的获取及处理:
(1)确定需要研究的领域,提取领域期刊数据;
(2)提取所需研究字段;
(3)对获取的字段进行预处理;
S2:动态异质网络演化聚类:
(1)对预处理所得的数据,确定不同时间片的网络快照;
(2)在第一个时刻,根据经验知识确定先验概率,将网络初始化为k类,在其他时刻,先验概率为将前一时刻的聚类作为下一时刻的先验分布;
(3)为每个聚类建立基于排序的概率生成模型,即可以通过调整相应聚类中对象的类型类分解相应的概率;
(4)为每种对象类型计算后验概率P(ck|o),可以通过以下方式来计算:
pt(ck|o)∝p(o|ck)×pt(ck);
(5)一旦后验概率计算完成,对象o可以使用一个向量进行表示v0=(P(c1|o),P(c2|o),...,P(cK|o)),通过使用先前的聚类分配,聚类之心的向量v为该聚类对象的平均值,通过使用v0和聚类质心之间的余弦相似度值,将对象o重新分配到每个聚类中;
(6)迭代第三步和第四步,直到聚类结果不会发生变化;
(7)返回聚类结果,并根据聚类结果,分析每个时间片的成员聚类,通过结合现有知识,分析产生聚类的原因,进一步了解发展现状,指导未来研究。
本发明步骤S1(1)中确定需要研究的领域提取领域期刊数据。
本发明步骤S1(2)中研究字段包括论文、作者、时间、发表期刊/会议,主题词字段。
本发明步骤S1(3)中预处理包括去除无意义词和重复词。
有益效果
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811270756.2/2.html,转载请声明来源钻瓜专利网。





