[发明专利]商品理解方法、装置及设备在审
申请号: | 202310183921.5 | 申请日: | 2023-02-21 |
公开(公告)号: | CN116310437A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 刘石磊;李林 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06V10/75 | 分类号: | G06V10/75;G06F16/9535;G06V10/82;G06Q30/0601 |
代理公司: | 北京同钧律师事务所 16037 | 代理人: | 柴海平;许怀远 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商品 理解 方法 装置 设备 | ||
1.一种商品理解方法,其特征在于,包括:
确定目标商品的文本信息以及目标商品的图像信息;
将所述文本信息、所述图像信息以及标签信息输入至预训练模型中,得到目标匹配分数;所述预训练模型基于样本商品的文本信息、样本商品的图像信息以及用户行为信息训练得到;
根据所述目标匹配分数,确定所述标签信息与所述目标商品是否匹配。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标匹配分数,确定所述标签信息与所述目标商品是否匹配,包括:在所述目标匹配分数大于或者等于第一预设阈值的情况下,确定所述标签信息与所述目标商品匹配;
在所述目标匹配分数小于第一预设阈值的情况下,确定所述标签信息与所述目标商品不匹配。
3.一种商品理解方法,其特征在于,包括:
将样本商品的文本信息以及样本商品的图像信息输入至初始模型中,通过所述初始模型执行预设复原任务,得到中间模型;
基于用户行为信息,构造样本数据;
根据所述样本数据对所述中间模型进行训练,得到预训练模型;所述预训练模型用于执行商品理解任务。
4.根据权利要求3所述的方法,其特征在于,所述将样本商品的文本信息以及商品数据的图像信息输入至初始模型中,通过所述初始模型执行预设复原任务,得到中间模型,包括:
根据所述样本商品的文本信息,获取所述文本信息对应的词向量;
根据所述样本商品的图像信息以及预设卷积网络,获取所述图像信息对应的图像块;
根据所述词向量以及所述图像块,通过所述初始模型执行文本遮盖复原任务和图像遮盖复原任务,得到所述中间模型。
5.根据权利要求4所述的方法,其特征在于,所述根据所述样本商品的图像信息以及预设卷积网络,获取所述图像信息对应的图像块,包括:
将所述图像信息对应的商品图像输入至所述预设卷积网络中,通过所述预设卷积网络对所述商品图像进行分割、编码,得到所述图像信息对应的图像块。
6.根据权利要求3所述的方法,其特征在于,所述样本数据包括正样本数据和负样本数据;所述基于用户行为信息,构造样本数据,包括:
基于所述用户行为信息,将预设行为对应的、具备匹配关系的第一搜索词和第一商品作为正样本数据;
针对每个所述正样本数据,将所述第一商品替换为相同类目的第二商品和/或将所述第一搜索词改写为第二搜索词,得到负样本数据;
将所述正样本数据与所述负样本数据进行混合,得到所述样本数据。
7.根据权利要求3所述的方法,其特征在于,每个所述样本数据中包括搜索词以及所述搜索词对应的样本商品;所述根据所述样本数据对所述中间模型进行训练,得到预训练模型,包括:
将所述样本数据输入至所述中间模型中,得到所述样本数据对应的匹配分数;所述匹配分数用于表征所述样本数据中的搜索词与所述样本商品的匹配程度;
基于所述匹配分数,确定损失函数以及损失值;
根据所述损失函数以及损失值进行参数调整,并对参数调整后的中间模型进行迭代训练。
8.根据权利要求7所述的方法,其特征在于,所述将所述样本数据输入至所述中间模型中,得到所述样本数据对应的匹配分数,包括:
将所述样本数据输入至中间模型中,得到所述样本数据对应的商品表征向量;
基于所述商品表征向量,确定所述样本数据对应的匹配分数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310183921.5/1.html,转载请声明来源钻瓜专利网。