[发明专利]模型训练方法、行为预测方法、装置、存储介质及设备在审
| 申请号: | 201910282139.2 | 申请日: | 2019-04-09 |
| 公开(公告)号: | CN111797858A | 公开(公告)日: | 2020-10-20 |
| 发明(设计)人: | 陈仲铭;何明 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
| 地址: | 523860 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 方法 行为 预测 装置 存储 介质 设备 | ||
1.一种模型训练方法,其特征在于,包括:
获取用户的历史行为数据;
将所述历史行为数据划分为多个数据段,每一数据段对应一时间段;
根据所述每一数据段获取至少一个行为向量;
将所述多个数据段的行为向量按照时间先后排列,集合形成训练数据;
将所述训练数据输入到时间序列模型中进行训练,得到行为预测模型。
2.根据权利要求1所述的模型训练方法,其特征在于,根据所述每一数据段获取至少一个行为向量,包括:
根据所述每一数据段中的数据类型选择对应的特征提取模型;
通过所述特征提取模型从所述数据段中提取出多个特征;
根据每一所述数据段中提取到的多个所述特征确定至少一个行为向量。
3.根据权利要求1所述的模型训练方法,其特征在于,所述训练数据输入到时间序列模型中进行训练,得到行为预测模型步骤之前,包括:
对所述训练数据中的每一行为向量进行数据维度对齐处理,以使得处理后的所述每一行为向量的特征数量相等。
4.根据权利要求3所述的模型训练方法,其特征在于,对所述训练数据中的每一行为向量进行数据维度对齐处理,以使得处理后的所述每一行为向量的特征数量相等,包括:
依次计算每一行为向量中的特征数量,得到最大特征数量;
从所述训练数据的多个行为向量中筛选出特征数量未达到最大特征数量的行为向量;
对所述特征数量未达到最大特征数量的每一行为向量进行特征数量填充。
5.根据权利要求1所述的模型训练方法,其特征在于,将所述多个数据段的行为向量按照时间先后排列,集合形成训练数据之前,包括:
为每一所述行为向量设置一行为类别标签。
6.根据权利要求1所述的模型训练方法,其特征在于,所述将所述训练数据输入到时间序列模型中进行训练,得到行为预测模型之后,包括:
根据所述行为预测模型获取所述预设时间段的预测结果;
获取所述预设时间段的真实结果;
采用交叉熵损失函数计算所述预测结果和所述真实结果之间的差异值;
判断所述差异值是否大于差异阈值;
若所述差异值大于所述差异阈值,对所述行为预测模型进行更新;
若所述差异值小于或等于所述差异阈值,维持所述行为预测模型。
7.一种行为预测方法,其特征在于,包括:
接收用户行为的预测请求;
根据所述预测请求获取预设时间段;
根据所述预设时间段和预先训练好的行为预测模型,预测所述预设时间段的用户行为;
其中,所述行为预测模型根据用户的历史行为数据和时间序列模型进行模型训练得到。
8.根据权利要求7所述的行为预测方法,其特征在于,所述根据所述预设时间段和预先训练好的行为预测模型,预测所述预设时间段的用户行为,包括:
在所述行为预测模型中输入所述预设时间段;
根据所述预设时间段匹配到至少一个目标行为向量;
获取所述目标行为向量对应的目标行为类别标签;
根据所述目标行为类别标签输出预设时间段的用户行为。
9.一种模型训练装置,其特征在于,所述装置包括:
第一获取模块,用于获取用户的历史行为数据;
数据划分模块,用于将所述历史行为数据划分为多个数据段,每一数据段对应一时间段;
第二获取模块,用于根据所述每一数据段获取至少一个行为向量;
数据集合模块,用于将所述多个数据段的行为向量按照时间先后排列,集合形成训练数据;
训练模块,用于将所述训练数据输入到时间序列模型中进行训练,得到行为预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910282139.2/1.html,转载请声明来源钻瓜专利网。





