[发明专利]数据分组方法、装置、电子设备及存储介质在审
| 申请号: | 201910304204.7 | 申请日: | 2019-04-16 |
| 公开(公告)号: | CN110162518A | 公开(公告)日: | 2019-08-23 |
| 发明(设计)人: | 叶素兰;李国才;刘卉;王秋施;贾怡 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06F16/215 | 分类号: | G06F16/215;G06Q30/02 |
| 代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 目标用户 存储介质 电子设备 事件数据 属性数据 数据分组 业务数据 标签 预定时间段 分组 分组标签 获取目标 匹配结果 准确率 预设 画像 申请 | ||
1.一种数据分组方法,其特征在于,所述方法包括:
获取目标用户的属性数据、业务数据及事件数据;
基于所述属性数据、业务数据及事件数据,获取所述目标用户的特征值组合;
基于所述目标用户的特征值组合、预定时间段内每个用户的特征值组合及对应的标签,确定所述目标用户的标签;
基于所述目标用户的标签与预设的分组标签集的匹配结果,对所述目标用户进行分组。
2.根据权利要求1所述的方法,其特征在于,获取目标用户的属性数据、业务数据及事件数据之后,包括:
基于预定数据清洗规则,对所述目标用户的属性数据、业务数据及事件数据进行数据清洗,以获取有效的目标用户的属性数据、业务数据及事件数据。
3.根据权利要求1所述的方法,其特征在于,所述基于所述属性数据、业务数据及事件数据,获取所述目标用户的特征值组合,包括:
获取预设特征组合模板,所述特征组合模板顺序描述了用户的各项特征;
对所述特征组合模板中的各特征,从所述属性数据、业务数据及事件数据中,确定所述目标用户在所述特征上的表现数据;
将所述表现数据、与对所述特征预设的基准数据的比值,确定为所述特征对应的特征值;
将各所述特征值,按照对应特征在所述特征组合模板中的顺序进行排列,得到所述目标用户的特征值组合。
4.根据权利要求1所述的方法,其特征在于,所述基于所述目标用户的特征值组合、预定时间段内每个用户的特征值组合及对应的标签,确定所述目标用户的标签,包括:将所述特征值组合输入机器学习模型,由机器学习模型输出目标用户的标签,其中,所述机器学习模型按照以下方式进行训练:对预定时间段内每个用户,将从所述用户的属性数据、业务数据及事件数据中提取出的特征值组合作为样本,并为所述样本贴上预定的标签;将所述样本输入机器学习模型,由机器学习模型输出判定的标签,如果判定的标签与对所述样本预定的标签不一致,调整机器学习模型,直到判定的标签与对所述样本预定的标签一致。
5.根据权利要求1所述的方法,其特征在于,所述基于所述目标用户的特征值组合、预定时间段内每个用户的特征值组合及对应的标签,确定所述目标用户的标签,包括:
针对预定时间段内每一用户的特征值组合,确定其中每个特征值与所述目标用户的特征值组合中相应特征值的差的绝对值,并确定所有所述绝对值的平均值;
确定预定时间段内每个用户的特征值组合中,所述平均值最小的特征值组合;
将所述平均值最小的特征值组合对应的标签,作为所述目标用户的标签。
6.根据权利要求1所述的方法,其特征在于,所述基于所述目标用户的特征值组合、以及预定时间段内每个用户的特征值组合与对应的标签,确定所述目标用户的标签,包括:
将所述目标用户的特征值组合,构造为目标用户特征值向量;
将所述预定时间段内每个用户的特征值组合,构造为对应的历史用户特征值向量;
确定所述目标用户特征值向量、与每个所述历史用户特征值向量的余弦距离;
将所述最大的余弦距离对应的历史用户特征值向量对应的特征值组合所对应的标签,作为所述目标用户的标签。
7.根据权利要求1所述的方法,其特征在于,所述基于所述目标用户的标签与预设的分组标签集的匹配结果,对所述目标用户进行分组,包括:
确定所述目标用户的标签与预设的分组标签集中标签相同的标签数;
将所述相同的标签数除以所述目标用户的标签总数,得到所述目标用户的标签与所述预设的分组标签集的匹配值;
如果所述匹配值大于或等于预定阈值,则将所述目标用户加入对应分组中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910304204.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据迁移方法、装置、设备及计算机可读存储介质
- 下一篇:数据清理方法





