[发明专利]数据分组方法、装置、电子设备及存储介质在审
申请号: | 201910304204.7 | 申请日: | 2019-04-16 |
公开(公告)号: | CN110162518A | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | 叶素兰;李国才;刘卉;王秋施;贾怡 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06Q30/02 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标用户 存储介质 电子设备 事件数据 属性数据 数据分组 业务数据 标签 预定时间段 分组 分组标签 获取目标 匹配结果 准确率 预设 画像 申请 | ||
本申请公开了一种数据分组方法、装置、电子设备及存储介质,涉及用户画像领域,该方法包括:获取目标用户的属性数据、业务数据及事件数据;基于所述属性数据、业务数据及事件数据,获取所述目标用户的特征值组合;基于所述目标用户的特征值组合、预定时间段内每个用户的特征值组合及对应的标签,确定所述目标用户的标签;基于所述目标用户的标签与预设的分组标签集的匹配结果,对所述目标用户进行分组。该方法提高了对用户进行分组的效率及准确率。
技术领域
本发明涉及用户画像领域,特别是涉及数据分组方法、装置、电子设备及存储介质。
背景技术
在互联网渗透进生活方方面面的今天,人们在互联网上进行着各类的活动,随着用户活动的进行,每时每刻都会产生海量的数据。对于许多企业来说,随着用户量的增长,如何对用户进行准确、快速的分组,对于提高企业管理效率来说有着重要意义。现有技术中,多是根据用户触发的特定事件对用户进行分组的。这种方法得出的分组结果往往较为片面,难以高效地对用户进行更为准确的分组。
发明内容
基于此,为解决相关技术中如何从技术层面上更加高效、准确地对用户进行分组所面临的技术问题,本发明提供了一种数据分组方法、装置、电子设备及存储介质。
第一方面,提供了一种数据分组方法,包括:
获取目标用户的属性数据、业务数据及事件数据;
基于所述属性数据、业务数据及事件数据,获取所述目标用户的特征值组合;
基于所述目标用户的特征值组合、预定时间段内每个用户的特征值组合与对应的标签,确定所述目标用户的标签;
基于所述目标用户的标签与预设的分组标签集的匹配结果,对所述目标用户进行分组。
在本公开的一示例性实施例中,获取目标用户的属性数据、业务数据及事件数据之后,包括:
基于预定数据清洗规则,对所述目标用户的属性数据、业务数据及事件数据进行数据清洗,以获取有效的目标用户的属性数据、业务数据及事件数据。
在本公开的一示例性实施例中,基于所述属性数据、业务数据及事件数据,获取所述目标用户的特征值组合,包括:
获取预设特征组合模板,所述特征组合模板顺序描述了用户的各项特征;
对所述特征组合模板中的各特征,从所述属性数据、业务数据及事件数据中,确定所述目标用户在所述特征上的表现数据;
将所述表现数据、与对所述特征预设的基准数据的比值,确定为所述特征对应的特征值;
将各所述特征值,按照对应特征在所述特征组合模板中的顺序进行排列,得到所述目标用户的特征值组合。
在本公开的一示例性实施例中,基于所述目标用户的特征值组合、预定时间段内每个用户的特征值组合及对应的标签,确定所述目标用户的标签,包括:将所述特征值组合输入机器学习模型,由机器学习模型输出目标用户的标签,其中,所述机器学习模型按照以下方式进行训练:对预定时间段内每个用户,将从所述用户的属性数据、业务数据及事件数据中提取出的特征值组合作为样本,并为所述样本贴上预定的标签;将所述样本输入机器学习模型,由机器学习模型输出判定的标签,如果判定的标签与对所述样本预定的标签不一致,调整机器学习模型,直到判定的标签与对所述样本预定的标签一致。
在本公开的一示例性实施例中,基于所述目标用户的特征值组合、以及预定时间段内每个用户的特征值组合与对应的标签,确定所述目标用户的标签,包括:
针对预定时间段内每一用户的特征值组合,确定其中每个特征值与所述目标用户的特征值组合中相应特征值的差的绝对值,并确定所有所述绝对值的平均值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910304204.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据迁移方法、装置、设备及计算机可读存储介质
- 下一篇:数据清理方法