[发明专利]通过计算机训练预测模型的方法及装置有效
申请号: | 201911395996.X | 申请日: | 2019-12-30 |
公开(公告)号: | CN111191722B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 蒋亮;温祖杰;梁忠平;张家兴 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06Q50/20 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 计算机 训练 预测 模型 方法 装置 | ||
1.一种通过计算机训练预测模型的方法,所述预测模型用于对业务数据进行处理,确定所述业务数据对应到预先确定的各个信息类别上的概率,以对所述业务数据进行分类操作,所述业务数据包括基于设备确定的历史操作数据;所述预测模型训练过程包括多个训练周期,各个训练周期对所有训练样本按照随机顺序进行遍历,其中,针对当前训练周期中的当前样本,所述方法包括:
将所述当前样本的特征数据输入所述预测模型,得到所述预测模型对所述当前样本预测的当前概率分布,所述当前概率分布描述所述当前样本在各个信息类别上分别对应的各个当前预测概率,所述特征数据基于所述历史操作数据确定;
根据所述当前样本对应的样本标签,以及各个当前预测概率,向损失函数的值减小的方向,确定对模型参数的第一调节指标,所述样本标签描述出用户偏好的信息类别;
获取所述当前训练周期之前的若干训练周期中,所述当前样本的历史概率分布,所述历史概率分布用于描述针对所述当前样本在所述若干训练周期中各个信息类别上分别对应的各个历史预测概率;
利用所述历史概率分布与所述当前概率分布的对比,确定对模型参数的第二调节指标;
基于所述第一调节指标和所述第二调节指标,调整模型参数,以训练所述预测模型,用于对用户的信息偏好进行预测。
2.根据权利要求1所述的方法,所述当前样本包括预定数量的训练样本,所述模型参数包括第一模型参数,所述第一模型参数在所述第一调节指标中对应第一调节量值;所述根据所述当前样本对应的样本标签,以及各个当前预测概率,向损失函数的值减小的方向,确定对模型参数的第一调节指标包括:
针对所述预定数量的训练样本中的各个训练样本,向损失函数的值减小的方向,分别确定对所述第一模型参数的各个调节量值;
将各个调节量值的平均值作为所述第一调节量值。
3.根据权利要求1所述的方法,其中,所述获取所述当前训练周期之前的若干训练周期中,所述当前样本的历史概率分布包括:
对所述若干训练周期中,所述当前样本分别对应的各个概率分布取平均,得到的概率分布作为所述历史概率分布。
4.根据权利要求1所述的方法,其中,所述利用所述历史概率分布与所述当前概率分布的对比,确定对模型参数的第二调节指标包括:
确定所述历史概率分布与所述当前概率分布的差异参数,所述差异参数包括以下中的一种:KL散度、交叉熵、JS散度、方差;
利用所述差异参数确定所述第二调节指标。
5.根据权利要求4所述的方法,其中,所述当前样本包括预定数量的训练样本,所述确定所述历史概率分布与所述当前概率分布的差异参数包括:
针对所述预定数量的训练样本中的各个训练样本,分别确定相应历史概率分布与相应当前概率分布的各个差异参数;
将各个差异参数的平均值作为所述历史概率分布与所述当前概率分布的差异参数。
6.根据权利要求4所述的方法,其中,所述当前样本包括预定数量的训练样本,所述预定数量的训练样本中的各个训练样本,分别对应各个差异参数,所述利用所述差异参数确定所述第二调节指标包括:
利用各个差异参数,分别确定对所述模型参数的各个调节指标;
将各个调节指标的平均值作为所述第二调节指标。
7.根据权利要求1所述的方法,其中,所述基于所述第一调节指标和所述第二调节指标,调整模型参数包括:
利用以下中的一项调整模型参数:
所述第一调节指标与所述第二调节指标的和;
所述第一调节指标与所述第二调节指标的加权和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911395996.X/1.html,转载请声明来源钻瓜专利网。