[发明专利]基于模式识别的社区搜索方法在审
申请号: | 201910830390.8 | 申请日: | 2019-09-04 |
公开(公告)号: | CN110610433A | 公开(公告)日: | 2019-12-24 |
发明(设计)人: | 马涛 | 申请(专利权)人: | 成都威嘉软件有限公司 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00 |
代理公司: | 11340 北京天奇智新知识产权代理有限公司 | 代理人: | 杨春 |
地址: | 610000 *** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 矩阵 网络图 模式识别 社交关系 社交网络 时间演进 社区 构建 搜索 编码代价函数 随时间变化 网络 间接邻居 累加误差 社区发现 网络转化 稳定结构 用户节点 噪声数据 阈值参数 时间段 子网络 链路 算法 突变 归属 分组 邻居 | ||
本发明提供了一种基于模式识别的社区搜索方法,该方法包括:根据用户节点之间的社交关系构建社交网络图;将随时间变化的社交网络图组成时间演进网络;将时间演进网络转化为社交关系矩阵,然后对所述矩阵进行编码,构建编码代价函数;通过对用户进行分组来划分社交网络,将结构相同的社交网络组成子网络,确定不同时间段下社区的稳定结构。本发明提出了一种基于模式识别的社区搜索方法,在面对具有链路缺失或具有噪声数据的网络时,有效降低了网络突变和累加误差对社区发现精度的影响,不仅考虑节点直接邻居的影响,还考虑间接邻居的影响,从而降低算法对邻域阈值参数的敏感性,有效提高社区归属结果的准确性。
技术领域
本发明涉及大数据,特别涉及一种基于模式识别的社区搜索方法。
背景技术
社交网络中用户由于共同的兴趣和社会属性而结成社区。社区通常由功能相近或性质相似的网络节点组成,在一定程度上反映了用户自发行为背后的局部弱规则性和全局有序性。对社交网络的社区结构的发现识别有助于揭示相互关联的用户如何形成复杂的社会网络,而且具有很多的实用价值,例如通过发现网络中的社区获取具有共同偏好兴趣或相似社会背景的群体。目前大部分社区发现技术都是面向自动社区发现问题,即根据网络结构,通过算法自动地发现网络中的社区,是一种无监督的方法。但自动算法通常存在两个重要的问题:用户获得的网络包含了大量包括错误连接在内的噪声数据,网络连接通常也是不完全的,自动社区发现的性能此时会大大下降,很难有效地识别网络中的真实社区结构;而且通过近似优化方法最大化模块度来发现社区,即使模块度值差得很小,也可能导致差异非常大的社区划分,不能得到一个最优的划分结果,更难以发现特定情境下满足特定需求的社区结构。
发明内容
为解决上述现有技术所存在的问题,本发明提出了一种基于模式识别的社区搜索方法,包括:
根据用户节点之间的社交关系构建社交网络图;
将随时间变化的社交网络图组成时间演进网络;
将时间演进网络转化为社交关系矩阵,然后对所述矩阵进行编码,构建编码代价函数;
通过对用户进行分组来划分社交网络,将结构相同的社交网络组成子网络,确定不同时间段下社区的稳定结构。
优选地,所述社区满足以下条件:
若邻接矩阵的非0元素比例大于预设阈值,则将TRtx={Itp,Jtq}作为t时刻社交网络的社区;其中Itp,Jtq分别为t时刻的第p个消息创建用户子集和t时刻的第q个消息转发用户子集;
所述邻接矩阵用于表示分割集Gtp,q=(Itp,Jtq,Etp,q),矩阵的行表示消息创建用户,列表示消息转发用户,用户间存在社交关系用1表示,不存在用0表示;且Etp,q为连接Itp与Jtq中用户节点的社交关系集。
优选地,所述构建编码代价函数之后,还包括,计算每个用户节点指派到子集的代价,通过比对不同指派代价来确定用户的子集归属。
优选地,将消息创建用户ai所在的创建用户子集与转发用户子集的社交关系定义为分布Q,Qq(1)表示该创建用户子集与第q个转发用户子集之间社交关系的耦合度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都威嘉软件有限公司,未经成都威嘉软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910830390.8/2.html,转载请声明来源钻瓜专利网。