[发明专利]数据处理方法、装置、计算机设备及存储介质在审
| 申请号: | 202110536355.2 | 申请日: | 2021-05-17 |
| 公开(公告)号: | CN113139101A | 公开(公告)日: | 2021-07-20 |
| 发明(设计)人: | 李奕霖;王珵;徐心;张佳音 | 申请(专利权)人: | 清华大学;北京达佳互联信息技术有限公司 |
| 主分类号: | G06F16/901 | 分类号: | G06F16/901;G06Q50/00 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 宁立存 |
| 地址: | 10008*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据处理 方法 装置 计算机 设备 存储 介质 | ||
1.一种数据处理方法,其特征在于,包括:
基于多个第一账号的互动行为,获取所述互动行为对应的账号关系图,所述账号关系图用于记录与所述第一账号发生过所述互动行为的账号,所述第一账号的被动关联账号符合第一目标条件;
从多个所述第一账号中,筛选得到多个第二账号,所述第二账号与账号群组具有映射关系,所述账号群组为具有目标社交关系的账号所构成的群组;
基于多个所述第二账号和所述账号关系图,从所述账号关系图所包含的账号中,筛选得到至少一个目标账号,所述目标账号的群组关联参数符合第二目标条件,所述群组关联参数用于表征所述目标账号与所述账号群组具有映射关系的可能性。
2.根据权利要求1所述的方法,其特征在于,所述基于多个所述第二账号和所述账号关系图,从所述账号关系图所包含的账号中,筛选得到至少一个目标账号包括:
基于多个所述第二账号和所述账号关系图,从多个所述第二账号中筛选得到至少一个种子账号,所述种子账号为所述账号关系图中所记录的所述第二账号;
基于各个种子账号,从所述账号关系图中筛选得到至少一个第三账号,每个第三账号均与一个种子账号具有对应关系;
获取各个第三账号的群组关联参数,将群组关联参数符合所述第二目标条件的第三账号确定为所述目标账号。
3.根据权利要求2所述的方法,其特征在于,所述基于多个所述第二账号和所述账号关系图,从多个所述第二账号中筛选得到至少一个种子账号包括:
获取所述账号关系图所记录的账号与多个所述第二账号之间的交集;
从所述交集所包含的各个账号中,筛选得到至少一个所述种子账号。
4.根据权利要求3所述的方法,其特征在于,所述从所述交集所包含的各个账号中,筛选得到至少一个所述种子账号包括:
基于所述交集所包含的各个账号的关联账号数量,为各个账号分配权重参数,所述权重参数用于表示各个账号被筛选为种子账号的可能性;
基于各个账号的权重参数,对各个账号进行抽样,得到至少一个所述种子账号。
5.根据权利要求2所述的方法,其特征在于,所述获取各个第三账号的群组关联参数包括:
对任一所述第三账号,基于所述第三账号在所述账号关系图中的度参数,获取所述第三账号的第一关联参数,所述度参数用于表示所述账号关系图中与第三账号相连的边数,所述第一关联参数用于表示所述第三账号在所述账号关系图中与所述账号群组的关联程度;
基于所述第三账号的账号特征,获取所述第三账号的第二关联参数,所述第二关联参数用于表示所述第三账号的账号特征与所述账号群组的关联程度;
基于所述第一关联参数和所述第二关联参数,获取所述第三账号的群组关联参数。
6.根据权利要求5所述的方法,其特征在于,响应于所述第三账号位于多个所述账号关系图中,所述基于所述第三账号在所述账号关系图中的度参数,获取所述第三账号的第一关联参数包括:
基于各个账号关系图中账号的度分布,对所述第三账号在各个账号关系图中的度参数进行标准化,得到所述第三账号的多个标准度参数;
基于各个账号关系图的关系图权重,对多个所述标准度参数进行加权,得到多个加权度参数;
基于多个所述加权度参数,获取所述第三账号的所述第一关联参数。
7.一种数据处理装置,其特征在于,包括:
第一获取单元,被配置为执行基于多个第一账号的互动行为,获取所述互动行为对应的账号关系图,所述账号关系图用于记录与所述第一账号发生过所述互动行为的账号,所述第一账号的被动关联账号符合第一目标条件;
第一筛选单元,被配置为执行从多个所述第一账号中,筛选得到多个第二账号,所述第二账号与账号群组具有映射关系,所述账号群组为具有目标社交关系的账号所构成的群组;
第二筛选单元,被配置为执行基于多个所述第二账号和所述账号关系图,从所述账号关系图所包含的账号中,筛选得到至少一个目标账号,所述目标账号的群组关联参数符合第二目标条件,所述群组关联参数用于表征所述目标账号与所述账号群组具有映射关系的可能性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;北京达佳互联信息技术有限公司,未经清华大学;北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110536355.2/1.html,转载请声明来源钻瓜专利网。





