[发明专利]检测同款商品的方法及装置在审
申请号: | 201910939649.2 | 申请日: | 2019-09-30 |
公开(公告)号: | CN110647630A | 公开(公告)日: | 2020-01-03 |
发明(设计)人: | 李翀;周成;李林杰;吴岗 | 申请(专利权)人: | 浙江执御信息技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06Q30/06 |
代理公司: | 33293 杭州快知知识产权代理事务所(特殊普通合伙) | 代理人: | 张超;杨冬玲 |
地址: | 310011 浙江省杭州市拱*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商品品牌 商品预测 文本信息 数据集 神经网络 训练神经网络 数据集中 预测结果 自动实现 种检测 输出 检测 预测 转化 | ||
1.一种检测同款商品的方法,其特征在于,包括如下步骤:
将用于训练的原始商品文本信息按照商品品牌分为不同的数据集;
确定同一商品品牌的数据集中商品之间的同款关系;
基于确定了上述同款关系的数据集训练神经网络得到同款商品预测模型;
将待检测同款关系的每对商品的商品文本信息输入训练好的神经网络,训练好的神经网络按照所述同款商品预测模型进行预测,输出该对商品是否为同款商品的预测结果。
2.根据权利要求1所述的方法,其特征在于,将用于训练的原始商品文本信息按照商品品牌分为不同的数据集具体包括:
提取原始商品文本信息中商品品牌字段的文本信息;
确定商品的品牌文本相似度阈值,根据提取的各商品品牌字段的文本信息计算编辑距离以及品牌最长字符数计算该商品的品牌文本相似度,若超过上述品牌文本相似度阈值,则确定为同一商品品牌;
将同一商品品牌的商品文本信息集中到同一个数据集存储。
3.根据权利要求1所述的方法,其特征在于,确定同一商品品牌的数据集中商品之间的同款关系是提取同一商品品牌的数据集中各个商品的商品标题、商品描述、型号、规格字段的文本信息进行比较确定是否为同款关系。
4.根据权利要求1所述的方法,其特征在于,基于确定了同款关系的数据集训练神经网络得到同款商品预测模型具体包括:
在确定了同款关系的数据集中取出一对商品的商品文本信息输入神经网络;
神经网络将该对商品的商品文本信息处理为相应的数值向量;
训练神经网络将该对商品的数值向量进行对比判断确定是否为同款,直到确定了同款关系的数据集中所有数据输入神经网络训练完成后得到同款商品预测模型。
5.根据权利要求4所述的方法,其特征在于,确定了同款关系的数据集分为训练集、验证集和测试集,通过训练集训练神经网络得到同款商品预测模型,通过验证集对训练好的神经网络同款商品预测模型进行验证,通过测试集对训练好的神经网络同款商品预测模型进行测试。
6.一种检测同款商品的装置,其特征在于,包括:
同品牌处理模块,将用于训练的原始商品文本信息按照商品品牌分为不同的数据集;
同款关系处理模块,用于确定同一商品品牌的数据集中商品之间的同款关系;
训练处理模块,用于基于确定了同款关系的数据集训练神经网络得到同款商品预测模型;
预测处理模块,用于将待检测同款关系的每对商品的商品文本信息输入训练好的神经网络,训练好的神经网络按照所述同款商品预测模型进行预测,输出该对商品是否为同款商品的预测结果。
7.根据权利要求6所述的装置,其特征在于,同品牌处理模块具体包括:
提取模块,用于提取原始商品文本信息中商品品牌字段的文本信息;
同一品牌商品确定模块,用于确定商品的品牌文本相似度阈值,根据提取的各商品品牌字段的文本信息计算编辑距离以及品牌最长字符数计算该商品的品牌文本相似度,若超过上述商品的品牌文本相似度阈值,则确定为同一商品品牌;
存储模块,用于将同一商品品牌的商品文本信息集中到同一个数据集存储。
8.根据权利要求6所述的装置,其特征在于,同款关系处理模块确定同一商品品牌的数据集中商品之间的同款关系是提取同一商品品牌的数据集中各个商品的商品标题、商品描述、型号、规格字段的文本信息进行比较确定是否为同款关系。
9.根据权利要求6所述的装置,其特征在于,训练处理模块具体包括:
输入处理模块,用于在确定了同款关系的数据集取出一对商品的商品文本信息输入神经网络;
数值向量处理模块,用于神经网络将所述商品文本信息处理为两个数值向量;
判断处理模块,用于训练神经网络将两个数值向量进行对比判断确定是否为同款,直到确定了同款关系的数据集中所有数据输入神经网络训练完成后得到同款商品预测模型。
10.根据权利要求6所述的装置,其特征在于,确定了同款关系的数据集分为训练集、验证集和测试集;
所述训练处理模块通过训练集训练神经网络得到同款商品预测模型,通过验证集对训练好的神经网络同款商品预测模型进行验证,通过测试集对训练好的神经网络同款商品预测模型进行测试。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江执御信息技术有限公司,未经浙江执御信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910939649.2/1.html,转载请声明来源钻瓜专利网。