[发明专利]一种基于特征匹配网络的社团划分方法和装置有效
申请号: | 201611110731.7 | 申请日: | 2016-12-06 |
公开(公告)号: | CN106709800B | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 李旭瑞;邱雪涛;赵金涛;钟毅;胡奕 | 申请(专利权)人: | 中国银联股份有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 200135 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 匹配 网络 社团 划分 方法 装置 | ||
1.一种基于特征匹配网络的社团划分方法,其特征在于,包括:
根据预设的K个哈希函数,确定每个账号信息对应的K位哈希向量;
将每个账号信息对应的哈希向量,顺序划分为m=K/k类子哈希向量;其中,k为每类子哈希向量中哈希向量的数量;
针对每个类,将子哈希向量相同的账号信息划分为同一组;
计算同一组内的各账号信息之间的相似度;
若所述各账号信息之间的相似度大于阈值,则在所述各账号信息之间建立互连边,形成特征匹配网络;
根据所述特征匹配网络,对所述各账号信息进行社团划分。
2.如权利要求1所述的方法,其特征在于,计算同一组内的各账号信息之间的相似度,包括:
若第i账号信息与第j账号信息位于n类同组中,则将n/m作为所述第i帐号信息与所述第j账号信息之间的相似度;所述第i账号信息与所述第j账号信息为所述各账号信息中的任一个。
3.如权利要求1所述的方法,其特征在于,计算同一组内的各账号信息之间的相似度,包括:
若第i账号信息与第j账号信息位于同一组中,统计所述第i账号信息的哈希向量与所述第j账号信息的哈希向量中位于同一位且哈希向量值相同的个数h;所述第i账号信息与所述第j账号信息为所述各账号信息中的任一个;
所述第i账号信息与所述第j账号信息的相似度s=h/K。
4.如权利要求1所述的方法,其特征在于,根据预设的K个哈希函数,确定每个账号信息对应的K位哈希向量,包括:
根据公式(1)确定所述每个账号信息对应的K位哈希向量
其中,2'b表示是一个二进制数,是预设的K个哈希函数中的一个,
表示账号信息的特征向量,其中,c1,c2…,cd表示账号信息的特征属性,表示随机选取的一个非零向量,
5.如权利要求1至4任一项所述的方法,其特征在于,根据所述特征匹配网络,对所述各账号信息进行社团划分,包括:
(1)将各账号信息划分在所述特征匹配网络中不同的社区中;
(2)根据各账号信息之间的相似度,计算每个账号信息的相似强度,从而生成节点相似强度矩阵;
(3)针对每个账号信息,从所述节点相似强度矩阵中所述账号信息所在的行,按相似强度从大到小的顺序尝试将所述账号信息划至其他社区中;若所述账号信息自第p社区划分至第q社区后的模块度差为正数,则将所述账号信息划分至第q社区后结束;
(4)重复执行,直到社区结构不再改变为止。
6.如权利要求5所述的方法,其特征在于,所述根据各账号信息之间的相似度,计算每个账号信息的相似强度,包括:
根据公式(2)计算所述第i账号信息与所述第j账号信息之间的相似强度si,j;
其中,Γ(i)表示所述第i账号信息的邻居集合,Γ(i)∩Γ(j)表示所述第i账号信息与所述第j账号信息的共同邻居集合,wai,z为任意账号信息ai与第z账号信息之间的边的权重和。
7.一种基于特征匹配网络的社团划分装置,其特征在于,包括:
确定单元,用于根据预设的K个哈希函数,确定每个账号信息对应的K位哈希向量;
第一划分单元,用于将每个账号信息对应的哈希向量,顺序划分为m=K/k类子哈希向量;其中,k为每类子哈希向量中哈希向量的数量;
第二划分单元,用于针对每个类,将子哈希向量相同的账号信息划分为同一组;
计算单元,用于计算同一组内的各账号信息之间的相似度;
形成网络单元,用于若所述各账号信息之间的相似度大于阈值,则在所述各账号信息之间建立互连边,形成特征匹配网络;
第三划分单元,用于根据所述特征匹配网络,对所述各账号信息进行社团划分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611110731.7/1.html,转载请声明来源钻瓜专利网。