[发明专利]数据处理方法、装置、计算机设备及存储介质在审
申请号: | 202110536355.2 | 申请日: | 2021-05-17 |
公开(公告)号: | CN113139101A | 公开(公告)日: | 2021-07-20 |
发明(设计)人: | 李奕霖;王珵;徐心;张佳音 | 申请(专利权)人: | 清华大学;北京达佳互联信息技术有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06Q50/00 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 宁立存 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 计算机 设备 存储 介质 | ||
本公开关于一种数据处理方法、装置、计算机设备及存储介质,属于计算机技术领域。本公开通过根据第一账号的互动行为构建对应的账号关系图,并从第一账号中筛选出属于某个账号群组的第二账号,利用第二账号和该账号关系图,结合图挖掘技术,以从该账号关系图所包含的账号中,筛选得到与第二账号同属于该账号群组的目标账号,无需人工对各个账号进行群组标注,大大节约了识别账号群组的人力和时间成本,提高了从海量账号中识别出账号群组内各账号的效率。
技术领域
本公开涉及计算机技术领域,特别涉及一种数据处理方法、装置、计算机设备及存储介质。
背景技术
随着计算机技术的发展和终端功能的多样化,用户能够利用终端随时随地浏览创作者(例如主播、up主等)发布的音视频资源。部分创作者可能会组成用户团体、以“网红(即网络红人)家族”的形式活跃在音视频平台上,已经具有相当大的经济影响力。因此,从音视频平台的海量注册用户中准确识别出各个用户团体,以及找出同一用户团体内的各个成员逐渐成为研究热点。
上述用户团体内的创作者成员大多为师徒关系或亲属关系,并互相关注、经常一起互动:如出现在彼此发布的视频作品中、发起联合直播、在作品评论区互动等。目前,主要通过人工标注的方式识别属于同一用户团体的创作者成员,也即,由技术人员通过观察创作者的公开信息以及发布的作品信息,结合业务经验来判断创作者是否属于某一用户团体。
发明内容
本公开提供一种数据处理方法、装置、计算机设备及存储介质,以至少节约识别账号群组的人工成本、提高账号群组的识别效率。本公开的技术方案如下:
根据本公开实施例的一方面,提供一种数据处理方法,包括:
基于多个第一账号的互动行为,获取所述互动行为对应的账号关系图,所述账号关系图用于记录与所述第一账号发生过所述互动行为的账号,所述第一账号的被动关联账号符合第一目标条件;
从多个所述第一账号中,筛选得到多个第二账号,所述第二账号与账号群组具有映射关系,所述账号群组为具有目标社交关系的账号所构成的群组;
基于多个所述第二账号和所述账号关系图,从所述账号关系图所包含的账号中,筛选得到至少一个目标账号,所述目标账号的群组关联参数符合第二目标条件,所述群组关联参数用于表征所述目标账号与所述账号群组具有映射关系的可能性。
在一种可能实施方式中,所述基于多个所述第二账号和所述账号关系图,从所述账号关系图所包含的账号中,筛选得到至少一个目标账号包括:
基于多个所述第二账号和所述账号关系图,从多个所述第二账号中筛选得到至少一个种子账号,所述种子账号为所述账号关系图中所记录的所述第二账号;
基于各个种子账号,从所述账号关系图中筛选得到至少一个第三账号,每个第三账号均与一个种子账号具有对应关系;
获取各个第三账号的群组关联参数,将群组关联参数符合所述第二目标条件的第三账号确定为所述目标账号。
在一种可能实施方式中,所述基于多个所述第二账号和所述账号关系图,从多个所述第二账号中筛选得到至少一个种子账号包括:
获取所述账号关系图所记录的账号与多个所述第二账号之间的交集;
从所述交集所包含的各个账号中,筛选得到至少一个所述种子账号。
在一种可能实施方式中,所述从所述交集所包含的各个账号中,筛选得到至少一个所述种子账号包括:
基于所述交集所包含的各个账号的关联账号数量,为各个账号分配权重参数,所述权重参数用于表示各个账号被筛选为种子账号的可能性;
基于各个账号的权重参数,对各个账号进行抽样,得到至少一个所述种子账号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;北京达佳互联信息技术有限公司,未经清华大学;北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110536355.2/2.html,转载请声明来源钻瓜专利网。