[发明专利]一种基于用户大数据的用户群体分析方法和系统有效
申请号: | 201510882509.8 | 申请日: | 2015-12-03 |
公开(公告)号: | CN105373619B | 公开(公告)日: | 2018-12-07 |
发明(设计)人: | 王蕾;罗忠富;谷静宜 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/02 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 王康;龙洪 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 数据 群体 分析 方法 系统 | ||
1.一种基于用户大数据的用户群体分析方法,其特征在于,所述方法包括:
构建用户与其标签的关系网络;所述关系网络中用户以节点表示,如果两个节点存在相同的标签,则建立所述两个节点之间的连接关系;两个节点连线的权重为两个节点间相同标签的个数;
遍历所述关系网络,将所述网络中权重最大的连线对应的两个节点合并为一个簇,将所述簇作为一个新的节点;
计算所述簇与所述网络中其他节点连线的权重;
如果更新后的关系网络还能进行节点的合并,继续获得新簇,直至更新后的关系网络中簇的个数已达到预设值,则更新后的关系网络中的簇包含的节点即为发现的相似用户群体。
2.如权利要求1所述的方法,其特征在于,其中,所述构建用户与其标签的关系网络,包括:
根据用户与其标签的关系构建原生二元网络,所述原生二元网络中,用户和标签分别以用户节点和标签节点表示,如果用户具备标签,则连接该用户节点和该标签节点;
对所述原生二元网络进行转换,隐藏标签节点,将具有相同标签的用户节点通过连线连接,两个节点间相同标签的个数作为所述连线的权重,得到所述用户与其标签的关系网络。
3.如权利要求1或2所述的方法,其特征在于,所述方法还包括:
从发现的相似用户群体中查找与其他节点具有最多连线,且连线权重之和最大的节点,将该节点代表的用户作为具备该群体主要特征的重要用户,所述群体主要特征指的是群体中大多数用户具备的特征。
4.如权利要求3所述的方法,其特征在于,所述方法还包括:
对发现的相似用户群体中每个节点Vi按照如下公式计算,
其中,n为相似用户群体中的总节点数,cluster(vi,vj)表示簇内节点i到簇内节点j的距离;
将对每个节点Vi的计算结果C(vi)按从大到小的顺序排序,最小的计算结果对应的节点vi为相似用户群体中距离其他节点最短的节点,将该节点代表的用户作为具备该群体通用特征的重要用户,所述群体通用特征指的是群体中每个用户均具备的特征。
5.如权利要求2所述的方法,其特征在于,所述方法还包括:
根据原生二元网络,在相似用户群体中建立标签关系网络;标签关系网络中标签以节点表示,如果两个节点存在相同的用户,则建立所述两个节点之间的连接关系;两个节点连线具有权重,连线的权重为两个节点间相同用户的个数;
在所述标签关系网络中寻找权重最大的边对应的两个节点,将所述两个节点作为该群体的主要特征。
6.一种基于用户大数据的用户群体分析系统,其特征在于,所述系统包括:
网络建立模块,用于构建用户与其标签的关系网络;所述关系网络中用户以节点表示,如果两个节点存在相同的标签,则建立所述两个节点之间的连接关系;两个节点连线的权重为两个节点间相同标签的个数;
相似群体寻找模块,用于遍历所述关系网络,将所述网络中权重最大的连线对应的两个节点合并为一个簇,将所述簇作为一个新的节点;计算所述簇与所述网络中其他节点连线的权重;如果更新后的关系网络还能进行节点的合并,继续获得新簇,直至更新后的关系网络簇的个数已达到预设值,则更新后的关系网络中的簇包含的节点即为发现的相似用户群体。
7.如权利要求6所述的系统,其特征在于,所述网络建立模块,用于构建用户与其标签的关系网络,包括:
根据用户与其标签的关系构建原生二元网络,所述原生二元网络中,用户和标签分别以用户节点和标签节点表示,如果用户具备标签,则连接该用户节点和该标签节点;
对所述原生二元网络进行转换,隐藏标签节点,将具有相同标签的用户节点通过连线连接,两个节点间相同标签的个数作为所述连线的权重,得到所述用户与其标签的关系网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510882509.8/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置