[发明专利]一种针对目标场景的预测模型训练方法及装置在审
申请号: | 201810958151.6 | 申请日: | 2018-08-22 |
公开(公告)号: | CN109214436A | 公开(公告)日: | 2019-01-15 |
发明(设计)人: | 曾利彬 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标场景 目标训练样本 预测模型训练 备选 预测误差 样本集 迭代 预设 优选 训练样本集 迭代处理 迭代结束 结束条件 筛选规则 训练样本 样本输入 预测模型 合并 加权 样本 标签 输出 预测 | ||
1.一种针对目标场景的预测模型训练方法,该方法包括:
获得N个源场景的N个带有标签的源训练样本集、及1个目标场景的1个带有标签的目标训练样本集;其中,N为预设正整数;
利用以下步骤进行迭代处理,直到达到预设结束条件:
针对N个源训练样本集中的每一样本集:将该样本集与目标训练样本集进行合并;利用合并得到的样本集,训练得到备选模型;将目标训练样本集中的各样本输入备选模型,根据模型输出的预测值及各样本的标签值,计算该模型的预测误差;
将所训练的N个备选模型中预测误差最小的模型,作为本次迭代得到的优选模型;
迭代结束后,根据预设筛选规则,从各次迭代得到的各优选模型中,选择全部或部分模型进行加权,得到针对目标场景的预测模型;其中,进行加权的任一优选模型的权重根据该模型的预测误差确定,并且预测误差与所确定权重的关系为负相关。
2.根据权利要求1所述的方法,在第一次迭代处理前,还包括:
确定所获得的N+1个样本集中各样本的预设样本权重;所述样本权重用于表示对应样本在样本集中的重要程度。
3.根据权利要求2所述的方法,所述迭代处理步骤,还包括:
针对所获得的N+1个样本集中的任一样本:根据预设的更新参数、及预设的更新规则,对本次迭代中该样本的样本权重进行更新,更新后的样本权重用于下次迭代;
其中,预设的更新参数包括:该样本的标签值、及将该样本输入本次迭代得到的优选模型后输出的预测值。
4.根据权利要求3所述的方法,所述根据预设的更新参数、及预设的更新规则,对本次迭代中该样本的样本权重进行更新,包括:
确定该样本的标签值、及将该样本输入本次迭代得到的优选模型后输出的预测值;
利用所确定标签值与预测值的差值的绝对值,对本次迭代中该样本的样本权重进行更新;
其中,在该样本为N个源训练样本集中的样本的情况下,更新结果与该绝对值的关系为负相关;在该样本为目标训练样本集中的样本的情况下,更新结果与该绝对值的关系为正相关。
5.根据权利要求1所述的方法,所述预设结束条件,包括:
迭代次数达到预设次数阈值;和/或
本次迭代得到的优选模型的预测误差小于预设误差阈值。
6.根据权利要求1所述的方法,所述根据模型输出的预测值及各样本的标签值,计算该模型的预测误差,包括:
获得该模型输出的各样本的预测值、以及各样本的标签值,并且确定各样本的预测值与标签值的差值;
确定预设的各样本的误差计算权重;
利用所确定的各样本的误差计算权重,对所确定的各样本的差值进行加权求和,得到该模型的预测误差。
7.根据权利要求6所述的方法,所述确定预设的各样本的误差计算权重,包括:
对于输入该模型的任一样本:获得本次迭代中该样本的样本权重,并将该样本权重确定为本次计算预测误差时该样本的误差计算权重;
其中,所述样本权重为预先设定和/或在迭代中计算得到,且用于表示对应样本在样本集中的重要程度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810958151.6/1.html,转载请声明来源钻瓜专利网。