[发明专利]一种线上商品身份唯一性识别确认系统在审
| 申请号: | 202110829721.3 | 申请日: | 2021-07-22 |
| 公开(公告)号: | CN113592512A | 公开(公告)日: | 2021-11-02 |
| 发明(设计)人: | 蔡毅辉;陈明君;贾艺璇 | 申请(专利权)人: | 上海普洛斯普新数字科技有限公司 |
| 主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06Q30/06;G06K9/32;G06K9/62;G06F16/901;G06F16/906;G06N3/04;G06N3/08 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 200135 上海市浦东新*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 线上 商品 身份 唯一 识别 确认 系统 | ||
1.一种线上商品身份唯一性识别确认系统,其特征在于:首先要收集品牌信息,构建品牌数据库,然后通过访问商品链接识别商品,具体步骤为:
步骤S10:首先对商品品牌及商品属性等信息收集,对信息进行人工核对、标记,构建品牌及属性词表数据库,根据词表的品牌或属性特征生成独热编码,供系统进行查询;
步骤S20:在系统内输入商品链接或推荐系统信息,系统访问商品链接详情页,通过信息提取器提取线上商品信息,将商品主要信息:品牌、子品牌、重量、产地等属性信息提取并进行统一化处理;
步骤S30:将上一步提取的商品信息返回给系统中,根据系统中已经建立的词表将商品信息转为对应的独热编码,首先建立品牌的独热编码,然后根据将能够描述商品最基本的信息的转换为对应的独热编码;能够描述商品的基本信息的属性不同,属性信息对应的独热编码的词表不同,独热编码表的长度不同,若有信息缺失,则使用缺省值填补;
步骤S40:将生成的独热编码进行组合,词表中存储的各类属性信息是无序的,通过循环神经网络计算属性对商品特征描述的权重,将商品信息的独热编码由商品特征的权重由高到低排列,将品牌独热编码和商品独热编码组合,生成商品唯一编码,并与对应的链接建立对应表,确认商品身份唯一识别有效性,并录入系统中。
2.根据权利要求1所述的一种线上商品身份唯一性识别确认系统,其特征在于:所述步骤S10中构建品牌及属性词表的具体过程为:
步骤S101:在商品销售网站上爬取商品的品牌及属性信息,包括商品品牌、子品牌、产地、重量等属性分类,建立表格,并记录品牌及属性信息的索引;
步骤S102:通过人工对表格进行校准,使品牌下的属性分类正确、属性完备:1)品牌的属性信息能够对品牌特征达到最基本的信息描述;2)每种属性下子分类能够对属性进行信息描述;
步骤S103:使用校准后的数据建立产品的词表,分别按属性的子分类建立独热编码,使每一个单独属性具有唯一的编码,当需要扩充词表时,按照子分类对属性描述的权重插入到词表中。
3.根据权利要求1所述的一种线上商品身份唯一性识别确认系统,其特征在于:所述的信息提取器包括标题提取器A201、文字描述提取器A202、图片描述提取器A203,信息提取器具体工作步骤为:
步骤S201:使用标题提取器对标题信息或系统推荐信息进行获取,首先将数据信息进行分词,将分词结果保存到缓存区,通过循环神经网络计算缓存区中分词结果的向量权重,去除品牌以外的描述信息,获取权重最高的向量,保留权重最高的分词结果,校验是否为商品中英文名称;
步骤S202:获取文字描述信息,首先判断是否存在文字描述,若存在,将文字描述按照段落、标点等特征进行属性分割,建立{属性:属性分类}字典;
步骤S203:获取图片描述,判断图片描述是否存在,若存在,对图片描述进行OCR识别,返回图片上文字信息及信息坐标,对返回值进行品牌属性提取,并进行统一化处理,建立{属性:属性分类}字典,并与文字描述提取器的结果进行对比,将属性补全完整;
步骤S204:将信息提取器所提取信息进行整合,根据属性信息对品牌描述的权重进行由高到低排序,组成完整商品信息及属性分类。
4.根据权利要求1所述的一种线上商品身份唯一性识别确认系统,其特征在于:所述步骤S30根据词表生成独热编码,具体的:1)针对同一品类不同品牌,构建品牌名的中英文词表,词表中每个品牌名只存在一条,固定词表中品牌出现位置,每一品牌占有一位,如需添加新品牌,在词表末尾插入;生成品牌独热编码时,对应品牌位为1,其他位为0;2)针对同一品牌不同属性,每一个属性建立词表,生成独热编码时,对应属性分类位为1,其他位为0;将所有属性转为独热编码,根据属性的权重排序,将独特编码拼接到一起。
5.根据权利要求1所述的一种线上商品身份唯一性识别确认系统,其特征在于:所述的步骤S30生成独热编码时,对应属性下属性分类缺失时,缺省值填补,缺省值可有人工修改。
6.根据权利要求1所述的一种线上商品身份唯一性识别确认系统,其特征在于:所述步骤S40建立商品对应表时,独热编码作为唯一识别的编码与商品链接对应,系统识别编码及识别商品本身属性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海普洛斯普新数字科技有限公司,未经上海普洛斯普新数字科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110829721.3/1.html,转载请声明来源钻瓜专利网。





