[发明专利]分类及分类模型训练方法、装置及存储介质在审
申请号: | 202210813655.5 | 申请日: | 2022-07-11 |
公开(公告)号: | CN115187809A | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 康战辉 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V20/40;G06V10/772;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京励诚知识产权代理有限公司 11647 | 代理人: | 熊金凤 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 模型 训练 方法 装置 存储 介质 | ||
本申请提供了一种分类及分类模型训练方法、装置及存储介质,本申请可应用于音乐、视频、语音等领域,该分类方法包括:获取目标短视频,并从目标短视频中获取N张第一图像;针对N张第一图像中的每一张第一图像,通过分类模型预测第一图像所包括的商品类别,其中分类模型在训练过程中对权值向量进行归一化处理;根据N张第一图像所包括的商品类别,确定推荐信息。本申请在分类模型的训练过程中,对权值向量进行归一化处理,这样可以降低首部数据对模型权值向量的影响,提升长尾数据对模型权值向量的影响,进而提升分类模型对长尾数据的学习。这样使用训练后的分类模型进行商品预测时,可以对目标短视频中的长尾商品进行准确识别,进而提高了商品识别准确性。
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种分类及分类模型训练方法、装置及存储介质。
背景技术
随着电子商务技术的发展,视频号商品或直播带货。在视频号商品或直播带货中包括多种商品,需要对这多种商品进行分类。
商品类图片一般种类繁多,经常存在部分商品数据标准样本不够,存在训练样本不均的问题。此时,使用通用的分类模型识别短视频中商品的分类,存在分类不准确的问题。
发明内容
本申请提供一种分类及分类模型训练方法、装置及存储介质,可以实现对短视频中商品的准确识别。
第一方面,本申请提供一种分类方法,包括:
获取目标短视频,并从所述目标短视频中获取N张第一图像,所述N为正整数;
针对所述N张第一图像中的每一张第一图像,通过分类模型预测所述第一图像所包括的商品类别,其中所述分类模型在训练过程中对权值向量进行归一化处理;
根据所述N张第一图像所包括的商品类别,确定推荐信息。
在一些实施例中,所述分类模型在训练过程中对所述权值向量进行归一化处理包括:
对所述权值向量进行分解,得到参数向量和参数标量;
根据所述参数向量和所述参数标量,对所述权值向量进行归一化处理。
在一些实施例中,所述分类模型在训练过程中的损失是根据第一权重,以及所述分类模型预测的训练图像中商品的分类预测值确定的;
其中,所述第一权重是根据所述训练图像所属的样本类别所包括的训练数据,在训练数据集中的占比确定的,所述占比与所述第一权重成负相关。
在一些实施例中,所述损失是根据所述第一权重和所述训练图像中的商品属于第一分类的预测值确定的,所述第一分类为所述训练图像中商品的真实分类。
在一些实施例中,所述损失是根据所述第一权重、第二权重和所述训练图像中的商品属于第一分类的预测值确定的;
其中,所述第二权重是根据所述训练图像中的商品属于第一分类的预测值确定的,所述第二权重与所述训练图像中商品属于第一分类的预测值负相关。
在一些实施例中,所述第二权重为第一数值与所述训练图像中商品属于第一分类的预测值的差值,所述第一数值为正数。
在一些实施例中,所述第二权重为第一数值与所述训练图像中商品属于第一分类的预测值之间的差值的r次方,所述第一数值为正数,所述r为非负数。
在一些实施例中,所述损失为第一乘积的负数与第二数值的乘积,所述第二数值是对所述商品属于第一分类的预测值进行对数运算得到的,所述第一乘积为所述第一权重与所述第二权重的乘积。
第二方面,本申请提供一种分类模型训练方法,包括:
获取训练图像,并通过分类模型对所述训练图像中的商品进行分类,得到所述商品的分类预测值,所述训练图像包括短视频中的商品图像帧;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210813655.5/2.html,转载请声明来源钻瓜专利网。