[发明专利]生成兴趣标签的方法、装置、计算机设备和存储介质在审
| 申请号: | 201910525807.X | 申请日: | 2019-06-18 | 
| 公开(公告)号: | CN110377821A | 公开(公告)日: | 2019-10-25 | 
| 发明(设计)人: | 苏显政;蔡健;郭凌峰 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 | 
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535 | 
| 代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 陈小娜 | 
| 地址: | 518052 广东省深圳市*** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 用户标识 应用程序类型 用户使用 标签 应用程序标识 计算机设备 存储介质 记录集 数据集 筛选 偏好 条件筛选 行为类型 应用程序 时间段 分类 准确率 画像 申请 | ||
1.一种生成兴趣标签的方法,所述方法包括:
获取在指定时间段内应用程序的用户使用记录集,计算每个应用程序标识对应于用户标识所对应的偏好值;所述用户使用记录集中的用户使用记录包括用户标识和应用程序标识;
基于应用程序标识确定应用程序类型,根据相同应用程序类型下的应用程序标识对应于用户标识所对应的所述偏好值,分别确定各应用程序类型的分类阈值;所述应用程序类型存在对应的预设兴趣标签;
根据基于所述用户使用记录集确定的各应用程序类型的用户使用数据集,并按照所述分类阈值进行条件筛选,以筛选出用户标识;
依照筛选出的用户标识所在用户使用数据集的应用程序类型所对应的预设兴趣标签,确定筛选出的用户标识所对应的兴趣标签。
2.根据权利要求1所述的方法,其特征在于,所述用户使用记录集中的用户使用记录还包括使用权重;所述根据在指定时间段内应用程序的用户使用记录集,计算每个应用程序标识对应于用户标识所对应的偏好值包括:
获取每个应用程序标识对应的用户数以及所述用户使用记录集对应的总用户数;
获取与所述用户标识和所述应用程序标识对应的使用权重;
根据所述总用户数与所述用户数的比重以及所述使用权重,计算每个应用程序标识对应于用户标识所对应的偏好值。
3.根据权利要求1所述的方法,其特征在于,所述根据相同应用程序类型下的应用程序标识对应于用户标识所对应的所述偏好值,分别确定各应用程序类型的分类阈值包括:
基于所述相同应用程序类型下的应用程序标识对应于用户标识所对应的偏好值,将相同应用程序类型各自对应的偏好值按升序进行排序,得到偏好值的排序结果;
根据所述偏好值的排序结果,计算相同应用程序类型下各自对应的每个偏好值的分位数;
依据所述分位数确定各应用程序类型的分类阈值。
4.根据权利要求3所述的方法,其特征在于,所述根据所述偏好值的排序结果,计算各应用程序类型下各自对应的每个偏好值的分位数包括:
根据所述偏好值的排序结果,确定各应用程序类型下的每个偏好值在相应排序结果中的出现概率;根据所述出现概率确定各应用程序类型下的每个偏好值的累积概率,得到各应用程序类型下的每个偏好值的分位数;或,
获取各应用程序类型下的每个偏好值在所处排序结果中的排序位以及各应用程序标识所属应用程序类型对应的排序用户数;将各应用程序类型下的每个偏好值在所处排序结果中的排序位除以所述排序用户数,获得各应用程序类型各自对应的每个偏好值的分位数。
5.根据权利要求3所述的方法,其特征在于,所述依据所述分位数确定各应用程序类型的分类阈值包括:
依据所述分位数,对应于每个应用程序类型,分别筛选出大于或等于相应预设阈值的分位数;
对应于每个应用程序类型,根据筛选出的分位数计算相邻的分位数的差值;
获取对应各应用程序类型计算出的每个最大的差值所对应的分位数,得到各应用程序类型的分类阈值。
6.根据权利要求1所述的方法,其特征在于,所述根据基于所述用户使用记录集确定的各应用程序类型的用户使用数据集,并按照所述分类阈值进行条件筛选,以筛选出用户标识包括:
获取已知兴趣标签的用户使用记录样本集;
根据所述用户使用记录样本集,对所述分类阈值进行调整;
根据所述用户使用数据集,并按照所述调整后的分类阈值进行条件筛选,以筛选出用户标识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910525807.X/1.html,转载请声明来源钻瓜专利网。





