[发明专利]商品理解方法、装置及设备在审
申请号: | 202310183921.5 | 申请日: | 2023-02-21 |
公开(公告)号: | CN116310437A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 刘石磊;李林 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06V10/75 | 分类号: | G06V10/75;G06F16/9535;G06V10/82;G06Q30/0601 |
代理公司: | 北京同钧律师事务所 16037 | 代理人: | 柴海平;许怀远 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商品 理解 方法 装置 设备 | ||
本申请实施例提供一种商品理解方法、装置及设备,该方法包括:电子设备确定目标商品的文本信息以及目标商品的图像信息;之后将文本信息、图像信息以及标签信息输入至预训练模型中,得到目标匹配分数;该预训练模型基于样本商品的文本信息、样本商品的图像信息以及用户行为信息训练得到;根据目标匹配分数,确定标签信息与目标商品是否匹配。这样,通过商品的文本信息、图像信息以及用户行为信息进行多模态训练,得到预训练模型,使得预训练模型的理解效果更好,能够提高商品标签识别以及商品属性预测等商品理解任务的准确度,提高商品理解的性能。
技术领域
本申请涉及计算机技术领域,尤其涉及一种商品理解方法、装置及设备。
背景技术
随着互联网技术的不断发展,线上购物逐渐融入用户的生活。商品理解可以是指以商品为中心的一系列任务,例如商品分类、相似商品匹配以及商品属性值预测等。优秀的商品理解能力将会提高用户的体验,且有利于下游的搜索和推荐系统。
在相关技术中,商品理解通常是采用较为简单的传统算法实现,例如文本匹配等,商品理解的性能不高,准确性较低。
发明内容
本申请的多个方面提供一种商品理解方法、装置及设备,用以提高商品理解的性能和准确性。
第一方面,本申请实施例提供一种商品理解方法,包括:
确定目标商品的文本信息以及目标商品的图像信息;
将所述文本信息、所述图像信息以及标签信息输入至预训练模型中,得到目标匹配分数;所述预训练模型基于样本商品的文本信息、样本商品的图像信息以及用户行为信息训练得到;
根据所述目标匹配分数,确定所述标签信息与所述目标商品是否匹配。
在一种可能的实施方式中,所述根据所述目标匹配分数,确定所述标签信息与所述目标商品是否匹配,包括:
在所述目标匹配分数大于或者等于第一预设阈值的情况下,确定所述标签信息与所述目标商品匹配;
在所述目标匹配分数小于第一预设阈值的情况下,确定所述标签信息与所述目标商品不匹配。第二方面,本申请实施例提供一种商品理解方法,包括:
将样本商品的文本信息以及样本商品的图像信息输入至初始模型中,通过所述初始模型执行预设复原任务,得到中间模型;
基于用户行为信息,构造样本数据;
根据所述样本数据对所述中间模型进行训练,得到预训练模型;所述预训练模型用于执行商品理解任务。
在一种可能的实施方式中,所述将样本商品的文本信息以及商品数据的图像信息输入至初始模型中,通过所述初始模型执行预设复原任务,得到中间模型,包括:
根据所述样本商品的文本信息,获取所述文本信息对应的词向量;
根据所述样本商品的图像信息以及预设卷积网络,获取所述图像信息对应的图像块;
根据所述词向量以及所述图像块,通过所述初始模型执行文本遮盖复原任务和图像遮盖复原任务,得到所述中间模型。
在一种可能的实施方式中,所述根据所述样本商品的图像信息以及预设卷积网络,获取所述图像信息对应的图像块,包括:
将所述图像信息对应的商品图像输入至所述预设卷积网络中,通过所述预设卷积网络对所述商品图像进行分割、编码,得到所述图像信息对应的图像块。
在一种可能的实施方式中,所述样本数据包括正样本数据和负样本数据;所述基于用户行为信息,构造样本数据,包括:
基于所述用户行为信息,将预设行为对应的、具备匹配关系的第一搜索词和第一商品作为正样本数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310183921.5/2.html,转载请声明来源钻瓜专利网。