[发明专利]一种电商评论多类目多客户快速定制化模型的方法和装置在审
申请号: | 201910161179.1 | 申请日: | 2019-03-04 |
公开(公告)号: | CN109902180A | 公开(公告)日: | 2019-06-18 |
发明(设计)人: | 李平章;王航;丁丁;郑圆 | 申请(专利权)人: | 上海宝尊电子商务有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/27;G06Q30/06 |
代理公司: | 上海卓阳知识产权代理事务所(普通合伙) 31262 | 代理人: | 周春洪 |
地址: | 200436 上海市静安*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 方法和装置 快速定制 构建 类目 神经网络模型 标注 客户 评论 标签 定制模型 快速训练 训练模块 定制化 品牌 表现 | ||
1.一种电商评论多类目多客户快速定制化模型的方法和装置,其特征在于,所述的一种电商评论多类目多客户快速定制化模型方法和装置包括以下主要步骤:
第一:最低粒度标签的构建:
S11.根据实际情况将训练集拆分成最低粒度标签,任意类目店铺需要的标签都可由最低粒度的标签组合而成,若不能组合,说明非最低粒度,需要继续拆分;
S12.根据新类目的引入会提出新的需求,导致原先最低粒度的标签不再是最低粒度,需按照S11的方式拆分成最低粒度,例:AB是配送快,当前最低粒度;新用户提出发货快和送货快的概念,则需要将原AB分拆成A发货快,B送货快;A和B就是新的最低粒度,AB不是;
第二:深度神经网络模型训练模块的构建:
S21.将S12的数据使用卷积神经网络进行训练,使用训练好的词向量,将分词结果转换为词向量;
S22.将转换后的词向量,使用2,3,4,5四种过滤器,分别做卷积与最大池化;
S23.定义损失函数,做全连接层进行sigmoid回归输出多分类概率;
S24.使用Adam优化算法训练,保存模型;
第三:深度神经网络模型标注模块的构建:
S31.将评论数据分句,每个子句做为输入文本;
S32.读取训练模型,将子句文本转化为标签分类概率,取大于0.5概率的标签;
S33.将子句组合成原句,并保存子句标签;
第四:标签聚合模块的构建:
S41.根据类目按图2所示构建pool表,通过最低粒度汇聚成标签。通过flag表示哪些是类目通用标签,包含所有店铺的,flag为N表示辅助标签不显示;
S42.构建change_name表,根据不同店铺需要设定转换需要改名的标签;
S43.构建label_hide表,根据不同店铺,隐藏非本店关注的类目通用标签。
2.根据权利要求1所述的电商评论多类目多客户快速定制化模型方法,其特征在于,所述步骤S12中,根据新增的定制化标签,检测是否含有当前最低粒度不可汇聚而成的标签,有则需要将原有粒度拆分至最低粒度至可汇聚成新标签。
3.根据权利要求1所述的电商评论多类目多客户快速定制化模型方法,其特征在于,所述步骤S41中,设计了一个方法,按每个类目设定具体的标签汇总方案,并显示通用标签模型,隐藏辅助标签。
4.根据权利要求1所述的电商评论多类目多客户快速定制化模型方法,其特征在于,所述步骤S42中,设计了一个方法,通过change_name表找到哪些客户需要对通用标签改名成符合自己的名字。
5.根据权利要求1所述的电商评论多类目多客户快速定制化模型方法,其特征在于,所述步骤S43中,设计了一个方法;通过label_hide表找到哪些标签对客户隐藏。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海宝尊电子商务有限公司,未经上海宝尊电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910161179.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于自然语言处理的筛选电商垃圾评论的方法
- 下一篇:文本的检测方法及装置