[发明专利]物品属性值的确定方法和装置在审
申请号: | 202110608525.3 | 申请日: | 2021-06-01 |
公开(公告)号: | CN113360724A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 王奕磊;王刚;佘志东 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F40/258;G06K9/62;G06N20/00 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 宗磊;杨倩 |
地址: | 100176 北京市北京经济技术*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物品 属性 确定 方法 装置 | ||
本发明公开了一种物品属性值的确定方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取目标物品的物品类目、物品属性名及物品标题;将所述物品类目、所述物品属性名及所述物品标题,输入所述属性抽取模型中,得到所述目标物品的物品属性值,所述物品属性值与所述物品属性名相对应;其中,所述属性抽取模型包括输入层、编码层及输出层,所述输入层的输入参数为所述物品类目、所述物品属性名及所述物品标题拼接的字符串,所述编码层用于将所述字符串编码为多个词向量,所述输出层基于所述多个词向量,确定所述物品属性名在所述物品标题中的标注信息。该实施方式能够准确地确定出物品属性值。
技术领域
本发明涉及计算机技术领域,尤其涉及一种物品属性值的确定方法和装置。
背景技术
在电商平台上,物品属性值的准确性直接或间接地影响到无货物品替换、相似物品推荐等具体的业务场景。已有的物品属性数据质量往往较差,主要表现在属性值错误、属性值不规范、属性值缺失等。但现有技术中尚缺少可准确地确定物品属性值的方法。
发明内容
有鉴于此,本发明实施例提供一种物品属性值的确定方法和装置,能够准确地确定物品属性值。
第一方面,本发明实施例提供了一种物品属性值的确定方法,包括:
获取目标物品的物品类目、物品属性名及物品标题;
将所述物品类目、所述物品属性名及所述物品标题,输入所述属性抽取模型中,得到所述目标物品的物品属性值,所述物品属性值与所述物品属性名相对应;其中,所述属性抽取模型包括输入层、编码层及输出层,所述输入层的输入参数为所述物品类目、所述物品属性名及所述物品标题拼接的字符串,所述编码层用于将所述字符串编码为多个词向量,所述输出层基于所述多个词向量,确定所述物品属性名在所述物品标题中的标注信息。
可选地,所述从所述物品标题中确定出所述目标物品的物品属性值之前,还包括:
获取多个样本的样本信息,所述样本信息包括:样本类目、样本标题、样本属性名及其对应的样本属性值;
根据所述样本信息,生成样本数据;
利用多个所述样本数据,训练机器学习模型,生成属性抽取模型。
可选地,所述根据多个样本信息,生成样本数据,包括:
获取当前样本的样本信息;
根据所述当前样本的样本属性值,对所述当前样本的样本标题进行标注处理;
生成所述当前样本的样本数据,所述样本数据中包括:样本类目、标注处理后的样本标题及样本属性名。
可选地,所述根据所述当前样本的样本属性值,对所述当前样本的样本标题进行标注处理,包括:
对所述当前样本的样本标题进行标题预处理;
对所述当前样本的样本属性值进行属性预处理;
在处理后的样本标题中,匹配出处理后的样本属性值,得到所述当前样本的样本属性名对应的标注信息,所述标注信息包括:起始位置及结束位置。
可选地,所述根据所述当前样本的样本属性值,对所述当前样本的样本标题进行标注处理,包括:
根据所述当前样本的样本属性值,按预设标注策略,对所述当前样本的样本标题进行标注处理,所述预设标注策略包括以下至少之一:规格属性硬匹配策略、最大子串匹配策略、正则表达式策略及软匹配策略。
可选地,所述根据多个样本信息,生成样本数据,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110608525.3/2.html,转载请声明来源钻瓜专利网。