[发明专利]用户类型的预测方法、装置、电子设备及可读存储介质在审
| 申请号: | 201811549960.8 | 申请日: | 2018-12-18 |
| 公开(公告)号: | CN109815980A | 公开(公告)日: | 2019-05-28 |
| 发明(设计)人: | 李星 | 申请(专利权)人: | 北京三快在线科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/9535;G06Q30/02 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用户类型 目标用户 历史特征 可读存储介质 预测 电子设备 行为数据 预测模型 样本 机器学习模型 历史时间段 准确度 时序 参考特征 场景信息 历史用户 序列输入 参考 | ||
1.一种用户类型的预测方法,其特征在于,所述方法包括:
依据目标用户在当前时间的行为数据和场景信息,生成所述目标用户的当前特征;
依据目标用户在目标历史时间段的行为数据和历史用户类型,生成所述目标用户的历史特征序列;
将所述当前特征以及所述历史特征序列输入至用户类型预测模型,得到所述目标用户的类型,所述用户类型预测模型使用用户类型样本对基于时序的机器学习模型训练得到,所述用户类型样本包括参考特征、历史特征序列、参考用户类型。
2.根据权利要求1所述的方法,其特征在于,所述用户类型预测模型通过如下步骤训练得到:
针对每个候选用户,确定所述候选用户在多个候选时间所处地址的地址类型、以及所述地址类型对应的用户类型;
针对每个候选用户的每个地址类型,根据所述候选时间计算所述地址类型的置信得分;
根据所述置信得分生成用户类型样本集;
根据所述用户类型样本集训练得到用户类型预测模型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述候选时间计算所述地址类型的置信得分的步骤,包括:
根据所述候选时间和预设基准时间计算所述地址类型的时间权重参数;
根据所述地址类型的数目和所述候选用户其余地址类型的数目,计算所述地址类型的占比参数;
计算所述地址类型的置信参数;
计算所述时间权重参数、所述占比参数、所述置信参数的乘积,得到所述地址类型的置信得分。
4.根据权利要求2所述的方法,其特征在于,所述根据所述置信得分生成用户类型样本集的步骤,包括:
针对每个候选用户,选取所述置信得分大于预设置信得分阈值,且所述置信得分最大的地址类型对应的用户类型作为所述候选用户的参考用户类型;
针对每个候选用户,依据所述候选用户在参考时间的行为数据和场景信息,生成所述候选用户的参考特征;
针对每个候选用户,依据所述候选用户在参考历史时间段的行为数据和真实用户类型,生成所述候选用户的历史特征序列,所述参考历史时间段为所述参考时间之前的指定时间段;
将所述候选用户的参考特征、历史特征序列、参考用户类型作为用户类型样本集中的样本。
5.根据权利要求4所述的方法,其特征在于,所述根据所述用户类型样本集训练得到用户类型预测模型的步骤,包括:
将所述候选用户的历史特征序列输入至级联网络中,得到用户类型的第一预测向量,所述级联网络由多个因子分解器和多个循环神经网络单元组成,所述每个因子分解器的输入为历史特征序列中的每个历史特征,所述第一个循环神经网络单元的输入为第一个因子分解器的输出,所述第一个循环神经网络单元之外的循环神经网络单元的输入为上一级因子分解器的输出和对应的因子分解器的输出,所述类型预测单元的输入为最后一个循环神经网络单元的输出和所述当前特征,输出为所述目标用户的类型;
将所述候选用户的参考特征输入至多层感知网络中,得到用户类型的第二预测向量;
将所述第一预测向量、第二预测向量拼接为第三预测向量,并根据所述第三预测向量确定用户类型的预测值;
根据所述用户类型的预测值和样本值计算损失值;
在所述损失值小于预设损失阈值的情况下,结束训练,当前状态的级联网络和多层感知网络为用户类型预测模型;
在所述损失值大于或等于预设损失阈值的情况下,调整所述级联网络和多层感知网络的状态参数,以继续训练。
6.一种用户类型的预测装置,其特征在于,所述装置包括:
当前特征生成模块,用于依据目标用户在当前时间的行为数据和场景信息,生成所述目标用户的当前特征;
历史特征序列生成模块,用于依据目标用户在目标历史时间段的行为数据和历史用户类型,生成所述目标用户的历史特征序列;
用户类型预测模块,用于将所述当前特征以及所述历史特征序列输入至预先训练的用户类型预测模型,得到所述目标用户的类型,所述用户类型预测模型使用用户类型样本对基于时序的机器学习模型训练得到,所述用户类型样本包括参考特征、历史特征序列、参考用户类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811549960.8/1.html,转载请声明来源钻瓜专利网。





