[发明专利]基于主题交互的社区发现方法有效
申请号: | 201510390683.0 | 申请日: | 2015-07-06 |
公开(公告)号: | CN105159911B | 公开(公告)日: | 2018-07-10 |
发明(设计)人: | 王柱;於志文;冯斌;郭斌 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00;G06K9/62 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 王鲜凯 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 贡献度 社区发现 超图模型 迭代计算 权值计算 种子节点 社区 聚合 层次聚类 主题节点 主题信息 准确度 时间段 构建 网络 中文 | ||
本发明公开了一种基于主题交互的社区发现方法,用于解决现有社区发现方法对社区描述准确度差的技术问题。技术方案是提取某一时间段内网络中文本、照片等的主题信息,根据网络中的每一次交互建立超图模型。对于超图模型按照用户熵以及主题熵计算超边的权值,选取用户中的种子节点,并根据超边权值计算不同节点的子图贡献度。迭代计算不同节点的贡献度,得到密集子图。以层次聚类方法对密集子图进行不同程度的聚合,得到不同层次下的社区。由于以种子节点出发构建初始子图,并根据超边权值计算不同节点的子图贡献度,然后迭代计算不同节点的贡献度,得到密集子图,对密集子图进行不同程度的聚合,得到不同主题节点对社区的贡献值,准确地描述社区。
技术领域
本发明涉及一种社区发现方法,特别是涉及一种基于主题交互的社区发现方法。
背景技术
社交网络属于复杂网络中的一种,是一种异构网络。在社交网络中不仅包括用户节点,其还包括由文本构成的主题节点,由用户签到信息构成的位置节点,由照片构成的兴趣节点等,暨社交网络不再是大量的性质相同节点的链接,而是许多不同类型的节点的相互链接。把不同性质节点因为在网络中的紧密交互行为而构成的密集子图称为网络中的社区。
针对复杂网络中的社区发现主要有两种方式:一种是将复杂网络简化为一般网络,暨只含有同种性质节点的网络,然后利用用户相似度,从而得到网络中的社区。另一种方式是将同质网络中的社区发现方法修正或提出新方法应用到复杂网络中,从而发现网络中的社区。第一种方法将复杂网络简化为一般网络,会明显的丢失网络中的信息,而且用户之间的关系不紧密,不利于进行社区发现,同时在完成社区的发现后,并不能直观的得知社区的特征,暨用户因为什么原因,对什么感兴趣而形成了一个社区,因为社区中并不直观的包含主题信息。第二种方法中,对一般方法的改变并不能完全适应在复杂网络中的社区发现,同时在完成社区发现后,也不能直观的通过观察社区得知不同主题节点对社区的贡献程度,暨社区特征的精确刻画。
文献“专利公开号是CN10428271A的中国发明专利”公开了首先一种社区发现方法,该方法通过用户在社交网络中发布的内容进行归档,并提取用户的兴趣特征,从而获取用户的兴趣特征集。之后通过构建用户关系图,并以不同用户间的兴趣相似度作为用户关系的权重,采用已有的加权五项网络社区发现算法发现网络中的重叠社区。该专利的一个不足之处是在得到社区的同时,并不知道这个社区是因为什么原因聚集在一起的,不能精准的对社区进行刻画。而且即使为了刻画社区,对社区中的所有用户发布的内容进行主题特征提取,但是这样得到的特征并不能很好的刻画社区,因为形成该社区的主题并不是得自用户的所有信息,而只是用户的部分信息所得。
发明内容
为了克服现有社区发现方法对社区描述准确度差的不足,本发明提供一种基于主题交互的社区发现方法。该方法提取某一时间段内网络中文本、照片等的主题信息,对于社交网络中的用户、主题关系,根据网络中的每一次交互建立超图模型。对于超图模型中的每一条边,按照用户熵以及主题熵计算超边的权值,选取用户中的种子节点,并以这些种子节点出发构建初始子图,并根据超边权值计算不同节点的子图贡献度。迭代计算不同节点的贡献度,使得子图的密度达到最大,得到密集子图。以层次聚类的方法对密集子图进行不同程度的聚合,得到不同层次下的社区。由于以种子节点出发构建初始子图,并根据超边权值计算不同节点的子图贡献度,然后迭代计算不同节点的贡献度,得到密集子图,对密集子图进行不同程度的聚合,得到不同主题节点对社区的贡献值,准确地描述社区。
本发明解决其技术问题所采用的技术方案是:一种基于主题交互的社区发现方法,其特点是采用以下步骤:
步骤一、采用LDA提取微博网络中文本的主题信息,根据微博网络中用户的每一次交互信息建立超图模型。超图模型中包括用户节点以及主题节点;每一次发布行为构成一条发布边u-t,其中u表示用户,t表示主题,每一次转发行为构成一条转发边u1-t1-u2,暨用户u1从用户u2处转发了主题为t1的微博文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510390683.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种素材处理、编辑、回迁方法及装置
- 下一篇:用于存储和查询数据的方法和系统