[发明专利]用户信息获取方法、装置、电子设备及存储介质有效
申请号: | 202010172307.5 | 申请日: | 2020-03-12 |
公开(公告)号: | CN111401433B | 公开(公告)日: | 2023-10-17 |
发明(设计)人: | 林岳;刘洪;张洁 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F18/2415 | 分类号: | G06F18/2415;G06F18/25;G06N3/0442;G06N3/047;G06N3/08;G06F17/18 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户信息 获取 方法 装置 电子设备 存储 介质 | ||
1.一种用户信息获取方法,其特征在于,所述方法包括:
获取用户的个人特征、用户活跃度的时间序列以及所述时间序列的统计特征,所述时间序列用于表示用户活跃度在统计周期内的变化规律,所述统计特征用于表示所述时间序列在统计学上的数据特征;
将所述个人特征、所述时间序列以及所述统计特征输入信息获取模型,通过所述信息获取模型预测所述用户属于不同活跃标签的预测概率,所述活跃标签用于表示所述用户在用户活跃周期中所处的阶段;
将预测概率符合目标条件的活跃标签确定为所述用户的活跃信息。
2.根据权利要求1所述的方法,其特征在于,所述信息获取模型为长短期记忆网络LSTM模型;
所述将所述个人特征、所述时间序列以及所述统计特征输入信息获取模型,通过所述信息获取模型预测所述用户属于不同活跃标签的预测概率包括:
将所述个人特征、所述时间序列以及所述统计特征输入LSTM模型中的至少一个记忆单元,通过所述至少一个记忆单元对所述个人特征、所述时间序列以及所述统计特征进行加权变换,得到所述用户的特征向量,所述特征向量的维度等于活跃标签的数量;
对所述特征向量进行指数归一化处理,得到所述用户属于不同活跃标签的预测概率。
3.根据权利要求1所述的方法,其特征在于,获取用户活跃度的时间序列包括:
抽样采集所述用户在统计周期内多个统计单位中的活跃度数据;
基于所述多个统计单位中的活跃度数据生成初始序列;
对所述初始序列进行平滑处理,得到所述时间序列。
4.根据权利要求3所述的方法,其特征在于,所述活跃度数据包括在线时长、活跃次数或者活跃天数中至少一项;
所述基于所述多个统计单位中的活跃度数据生成初始序列包括:
对任一个统计单位,对所述统计单位中的在线时长、活跃次数或者活跃天数中至少一项进行加权以及归一化处理,得到所述用户在所述统计单位内的活跃度指标;
按照所述用户在不同统计单位内的活跃度指标,构建所述初始序列,所述初始序列中一个元素用于表示所述用户在一个统计单位内的活跃度指标。
5.根据权利要求3所述的方法,其特征在于,平滑处理的方式包括差值平均、移动平均或者指数平均中至少一项。
6.根据权利要求1所述的方法,其特征在于,所述统计特征包括所述时间序列的均值、方差、极大值、极小值、增长率、下降率、波动率或者周期性中至少一项。
7.根据权利要求1所述的方法,其特征在于,所述信息获取模型的训练过程包括:
获取样本用户的样本个人特征、样本时间序列、所述样本时间序列的样本统计特征以及所述样本用户的参考标签;
基于所述样本个人特征、所述样本时间序列、所述样本统计特征以及所述参考标签,对初始获取模型进行训练,得到所述信息获取模型。
8.一种用户信息获取装置,其特征在于,所述装置包括:
获取模块,用于获取用户的个人特征、用户活跃度的时间序列以及所述时间序列的统计特征,所述时间序列用于表示用户活跃度在统计周期内的变化规律,所述统计特征用于表示所述时间序列在统计学上的数据特征;
预测模块,用于将所述个人特征、所述时间序列以及所述统计特征输入信息获取模型,通过所述信息获取模型预测所述用户属于不同活跃标签的预测概率,所述活跃标签用于表示所述用户在用户活跃周期中所处的阶段;
确定模块,用于将预测概率符合目标条件的活跃标签确定为所述用户的活跃信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010172307.5/1.html,转载请声明来源钻瓜专利网。