[发明专利]用户分类方法及装置有效
| 申请号: | 201911078245.5 | 申请日: | 2019-11-06 |
| 公开(公告)号: | CN110837862B | 公开(公告)日: | 2021-10-01 |
| 发明(设计)人: | 邱鑫;吴春成;邱泰生 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 崔晓岚;张颖玲 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用户 分类 方法 装置 | ||
1.一种用户分类方法,其特征在于,所述方法包括:
统计不同用户针对应用的使用时长,并确定所述使用时长的平均值;
基于所述使用时长的平均值将一天划分成不同的时间段,并获取在所述不同的时间段内的所述应用的用户规模;
针对用户规模超过规模阈值的时间段,获取对应时间段内的用户针对所述应用进行操作生成的操作数据;
从所述操作数据中选取满足以下条件至少之一的功能:使用频次超出频次阈值的功能,路径深度超过深度阈值的功能;
将所述选取的功能按照所述用户在所述应用中使用的先后顺序进行组合,得到对应所述用户的功能序列;
对所述用户的功能序列中的每个功能的名称进行词嵌入处理,得到所述每个功能对应的向量;
将所述功能序列中每个功能对应的向量顺序进行组合,得到对应所述用户的功能序列矩阵,并确定所述功能序列矩阵中多个功能对应的向量的平均值;
对多个用户分别对应的所述向量的平均值进行聚类处理,得到每个功能序列矩阵对应的用户所属的类别;
对于每一类用户群体,分别确定所述用户群体针对预设功能的偏好程度,其中,所述预设功能包括使用频次超过频次阈值,且在所述应用中的路径深度超过深度阈值的功能;
基于所述偏好程度,对所述用户群体进行相关功能的推荐。
2.根据权利要求1所述的方法,其特征在于,所述使用时长是用户从开始使用所述应用到结束使用所述应用的时间间隔;
其中,所述开始使用所述应用的场景包括:所述应用的进程被启动,所述应用从后台切换到前台;所述结束使用所述应用的场景包括:所述应用的进程被结束,所述应用被从前台切换到后台。
3.根据权利要求1所述的方法,其特征在于,所述对所述用户的功能序列中的每个功能的名称进行词嵌入处理,得到所述每个功能对应的向量,包括:
确定用于训练跳字模型的滑动窗口尺寸;
根据所述滑动窗口尺寸获取训练样本对,其中,每组训练样本对包括输入样本和输出样本;
根据训练样本对训练所述跳字模型,得到所述跳字模型的隐含层的参数;
基于训练好的跳字模型对所述功能序列进行词嵌入处理,得到所述功能序列中每个功能对应的向量。
4.根据权利要求1所述的方法,其特征在于,所述对多个用户分别对应的所述向量的平均值进行聚类处理,得到每个功能序列矩阵对应的用户所属的类别,包括:
根据多个用户分别对应的所述向量的平均值进行聚类处理,得到对应不同类别的多个平均值组合,其中,每个平均值组合包括部分用户对应的平均值;
根据每个用户的平均值所属的平均值组合对应的类别,确定相应用户所属的类别。
5.根据权利要求4所述的方法,其特征在于,所述根据多个用户分别对应的所述向量的平均值进行聚类处理,包括:
将所述多个用户分别对应的所述向量的平均值随机分配到k个平均值组合;
当所述k个平均值组合未满足收敛条件时,迭代更新所述k个平均值组合中包括的向量的平均值,直至满足所述收敛条件;
其中,k表示所述多个平均值组合的数量,且k为大于或等于1的整数;
所述收敛条件包括以下至少之一:同一类别的平均值组合内的向量的平均值之间的相似度大于第一相似度阈值,不同类别的平均值组合之间的向量的平均值的相似度小于第二相似度阈值;其中,所述第一相似度阈值大于所述第二相似度阈值。
6.根据权利要求5所述的方法,其特征在于,根据多个用户分别对应的所述向量的平均值进行聚类处理之前,所述方法还包括:
遍历k,以确定所述k与基于所述k对所述多个用户对应的所述向量的平均值进行分组的误差之间的关系曲线;
将所述关系曲线的拐点处对应的k的取值确定为所述多个平均值组合的数量的最终取值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911078245.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种降噪方法及电子设备
- 下一篇:一种分级控制数据交换速率的方法及装置





