[发明专利]社团划分方法和装置在审

专利信息
申请号: 202010378391.6 申请日: 2020-05-07
公开(公告)号: CN111581530A 公开(公告)日: 2020-08-25
发明(设计)人: 高树立;赵占永 申请(专利权)人: 北京互金新融科技有限公司
主分类号: G06F16/9536 分类号: G06F16/9536;G06Q50/00
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 王淼
地址: 100080 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 社团 划分 方法 装置
【说明书】:

本申请公开了一种社团划分方法和装置,其中,该方法包括:获取特征关系集合和社交关系集合,其中,特征关系集合包括与目标任务相关的行为特征的特征数据集,社交关系集合包括待划分社团中用户之间的社交关系的关系数据集;将特征关系集合和社交关系集合进行整合,得到整合数据集;依据模块度函数对整合数据集进行社团划分,其中,模块度函数表征整合数据集中节点之间的紧密程度。本申请解决了相关技术中基于用户的社交关系划分社团,导致用户覆盖率低、适应性差的技术问题。

技术领域

本申请涉及数据处理领域,具体而言,涉及一种社团划分方法和装置。

背景技术

在研究复杂的社会、技术以及信息系统时,常常把这些系统描述成网络。在这样的关系网络中,节点代表一个成员,而边代表成员之间的关系。社团划分是指根据网络的属性特征把关系网络中各节点划分到各个具有特殊含义的社团中。社团内部节点之间的连接很紧密,而在社团之间的连接相对松散。

传统的社团划分方法通常基于用户的社交关系进行划分。然而,基于社交关系构建的网络只能覆盖关系能够触达的用户,不能覆盖关系外的用户,即只能找到有社交关系的社团,但是不能说明社团中的用户具有某一种相似的用户行为,因而难以适用于更复杂的场景中,例如营销场景。

针对相关技术中基于用户的社交关系划分社团,导致用户覆盖率低、适应性差的技术问题,目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种社团划分方法和装置,以至少解决相关技术中基于用户的社交关系划分社团,导致用户覆盖率低、适应性差的技术问题。

根据本发明实施例的一个方面,提供了一种社团划分方法,包括:获取特征关系集合和社交关系集合,其中,特征关系集合包括与目标任务相关的行为特征的特征数据集,社交关系集合包括待划分社团中用户之间的社交关系的关系数据集;将特征关系集合和社交关系集合进行整合,得到整合数据集;依据模块度函数对整合数据集进行社团划分,其中,模块度函数表征整合数据集中节点之间的紧密程度。

可选地,特征关系集合基于如下步骤构建:基于行为特征构建决策树,其中,决策树的每个节点表征一个用户群体;采样决策树上的节点,生成特征关系集合。

可选地,基于行为特征构建决策树,包括:从行为特征中随机选取部分特征作为决策树的第一层节点;从特征取值空间中选取一个分裂点进行划分;循环执行上述两个步骤,逐层构建决策树,直至遍历所有行为特征或满足预设条件。

可选地,采样决策树上的节点,生成特征关系集合,包括:对节点中的用户群体进行笛卡尔积操作;采样笛卡尔积操作后的结果,得到特征关系集合。

可选地,依据模块度函数对整合数据集进行社团划分,包括:基于模块度函数确定整合数据集中各节点的模块度增益,其中,模块度增益表征节点加入到邻居节点后的模块度,减去节点的模块度和邻居节点的模块度后所得到的变化量;将节点加入到模块度增益最大的邻居节点中,直到所有节点的结构不再变化,得到划分好的社团。

可选地,模块度增益包括第一参数和第二参数,其中,第一参数表征特征关系集合在整合数据集中所占的权重,第二参数表征社交关系集合在整合数据集中所占的权重。

可选地,第一参数和第二参数为依赖目标任务的超参数。

根据本发明实施例的另一方面,还提供了一种社团划分装置,包括:获取模块,用于获取特征关系集合和社交关系集合,其中,特征关系集合包括与目标任务相关的行为特征的特征数据集,社交关系集合包括待划分社团中用户之间的社交关系的关系数据集;整合模块,用于将特征关系集合和社交关系集合进行整合,得到整合数据集;划分模块,用于依据模块度函数对所述整合数据集进行社团划分,其中,所述模块度函数表征所述整合数据集中节点之间的紧密程度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京互金新融科技有限公司,未经北京互金新融科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010378391.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top