[发明专利]一种线上商品身份唯一性识别确认系统在审

专利信息
申请号: 202110829721.3 申请日: 2021-07-22
公开(公告)号: CN113592512A 公开(公告)日: 2021-11-02
发明(设计)人: 蔡毅辉;陈明君;贾艺璇 申请(专利权)人: 上海普洛斯普新数字科技有限公司
主分类号: G06Q30/00 分类号: G06Q30/00;G06Q30/06;G06K9/32;G06K9/62;G06F16/901;G06F16/906;G06N3/04;G06N3/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 200135 上海市浦东新*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 线上 商品 身份 唯一 识别 确认 系统
【权利要求书】:

1.一种线上商品身份唯一性识别确认系统,其特征在于:首先要收集品牌信息,构建品牌数据库,然后通过访问商品链接识别商品,具体步骤为:

步骤S10:首先对商品品牌及商品属性等信息收集,对信息进行人工核对、标记,构建品牌及属性词表数据库,根据词表的品牌或属性特征生成独热编码,供系统进行查询;

步骤S20:在系统内输入商品链接或推荐系统信息,系统访问商品链接详情页,通过信息提取器提取线上商品信息,将商品主要信息:品牌、子品牌、重量、产地等属性信息提取并进行统一化处理;

步骤S30:将上一步提取的商品信息返回给系统中,根据系统中已经建立的词表将商品信息转为对应的独热编码,首先建立品牌的独热编码,然后根据将能够描述商品最基本的信息的转换为对应的独热编码;能够描述商品的基本信息的属性不同,属性信息对应的独热编码的词表不同,独热编码表的长度不同,若有信息缺失,则使用缺省值填补;

步骤S40:将生成的独热编码进行组合,词表中存储的各类属性信息是无序的,通过循环神经网络计算属性对商品特征描述的权重,将商品信息的独热编码由商品特征的权重由高到低排列,将品牌独热编码和商品独热编码组合,生成商品唯一编码,并与对应的链接建立对应表,确认商品身份唯一识别有效性,并录入系统中。

2.根据权利要求1所述的一种线上商品身份唯一性识别确认系统,其特征在于:所述步骤S10中构建品牌及属性词表的具体过程为:

步骤S101:在商品销售网站上爬取商品的品牌及属性信息,包括商品品牌、子品牌、产地、重量等属性分类,建立表格,并记录品牌及属性信息的索引;

步骤S102:通过人工对表格进行校准,使品牌下的属性分类正确、属性完备:1)品牌的属性信息能够对品牌特征达到最基本的信息描述;2)每种属性下子分类能够对属性进行信息描述;

步骤S103:使用校准后的数据建立产品的词表,分别按属性的子分类建立独热编码,使每一个单独属性具有唯一的编码,当需要扩充词表时,按照子分类对属性描述的权重插入到词表中。

3.根据权利要求1所述的一种线上商品身份唯一性识别确认系统,其特征在于:所述的信息提取器包括标题提取器A201、文字描述提取器A202、图片描述提取器A203,信息提取器具体工作步骤为:

步骤S201:使用标题提取器对标题信息或系统推荐信息进行获取,首先将数据信息进行分词,将分词结果保存到缓存区,通过循环神经网络计算缓存区中分词结果的向量权重,去除品牌以外的描述信息,获取权重最高的向量,保留权重最高的分词结果,校验是否为商品中英文名称;

步骤S202:获取文字描述信息,首先判断是否存在文字描述,若存在,将文字描述按照段落、标点等特征进行属性分割,建立{属性:属性分类}字典;

步骤S203:获取图片描述,判断图片描述是否存在,若存在,对图片描述进行OCR识别,返回图片上文字信息及信息坐标,对返回值进行品牌属性提取,并进行统一化处理,建立{属性:属性分类}字典,并与文字描述提取器的结果进行对比,将属性补全完整;

步骤S204:将信息提取器所提取信息进行整合,根据属性信息对品牌描述的权重进行由高到低排序,组成完整商品信息及属性分类。

4.根据权利要求1所述的一种线上商品身份唯一性识别确认系统,其特征在于:所述步骤S30根据词表生成独热编码,具体的:1)针对同一品类不同品牌,构建品牌名的中英文词表,词表中每个品牌名只存在一条,固定词表中品牌出现位置,每一品牌占有一位,如需添加新品牌,在词表末尾插入;生成品牌独热编码时,对应品牌位为1,其他位为0;2)针对同一品牌不同属性,每一个属性建立词表,生成独热编码时,对应属性分类位为1,其他位为0;将所有属性转为独热编码,根据属性的权重排序,将独特编码拼接到一起。

5.根据权利要求1所述的一种线上商品身份唯一性识别确认系统,其特征在于:所述的步骤S30生成独热编码时,对应属性下属性分类缺失时,缺省值填补,缺省值可有人工修改。

6.根据权利要求1所述的一种线上商品身份唯一性识别确认系统,其特征在于:所述步骤S40建立商品对应表时,独热编码作为唯一识别的编码与商品链接对应,系统识别编码及识别商品本身属性。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海普洛斯普新数字科技有限公司,未经上海普洛斯普新数字科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110829721.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top