[发明专利]一套自动化标签体系及系统在审
| 申请号: | 202110312386.X | 申请日: | 2021-03-24 |
| 公开(公告)号: | CN113159709A | 公开(公告)日: | 2021-07-23 |
| 发明(设计)人: | 林乐新;刘剑逸 | 申请(专利权)人: | 深圳闪回科技有限公司 |
| 主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06Q10/06;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 深圳众邦专利代理有限公司 44545 | 代理人: | 王金 |
| 地址: | 518000 广东省深圳市南山区粤海街道麻岭*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一套 自动化 标签 体系 系统 | ||
本发明属于标签设定技术领域,尤其为一套自动化标签体系及系统,包括数据集生成模块、训练模块、预测模块、数据上传模块和标签生成模块,其中,所述数据上传模块用于上传原始数据信息,生成原始数据库;所述数据集生成模块用于将原始数据库生成训练集和测试集,基于MECE原则对标签大类进行定义;本发明通过自动化标签生成机制及自动化标签设定机制,使标签的创建及设定自动化且形成闭环;由此解决了当前业务重运营模式下,难以量化指标、进行活动及运营效果分析,无法真实反映用户体验,数据分析效率低下的问题;通过自动化标签系统,将大量人力工作优化为精准度、效率更高的模式,达到了线下业务精细化运营、精细化风控的效果。
技术领域
本发明属于标签设定技术领域,具体涉及一套自动化标签体系及系统,特别涉及一套完备的针对线下门店、店员及商品的自动化标签设定、调整体系。
背景技术
在标签设置场景中,经常需要加入人为判断,导致信息失真,从而影响产品及运营人员做出正确的决策。目前企业内常见的打标签方式有以下两种:
第一种方式:通过人工方式,进行框架分析、标签组构造、具体标签设计,后再根据人工方式,聘请大量内容审核人员/运营人员,对业务对象的数据进行分析,并人工对这些对象进行标签设定。但是,这种方式会导致标签的结果带有大量的打标签人员的个人情绪,因此,无法真实地反映出业务的真实场景,从而导致后续根据标签数据进行分析并优化产品方案后,与用户真实使用软件时的感受有偏差。
第二种方式:通过接入第三方标签设定机构,由对方输出完整解决方案,并提供人力进行协助。在这种方式中,对企业来说较为便利,但一般第三方机构输出方案通用性普遍较差,方案费用成本普遍偏高,且由于是外部团队开发,整体沟通交流效率低下,信息保真度较低。
由此可见,目前在针对业务,存在着通用性差、无法真实反映用户体验,或效率低下、耗费人力过多的缺陷。
发明内容
为解决现有技术中存在的上述问题,本发明提供了一套自动化标签体系及系统,具有精准度高、效率高特点。
为实现上述目的,本发明提供如下技术方案:一套自动化标签体系及系统,包括数据集生成模块、训练模块、预测模块、数据上传模块和标签生成模块,其中,所述数据上传模块用于上传原始数据信息,生成原始数据库;
所述数据集生成模块用于将原始数据库生成训练集和测试集,基于MECE原则对标签大类进行定义;
所述训练模块用于根据训练集和测试集来训练神经网络,得到能够拟合数据的模型,通过使用Java集成kettle的方式,以实现对业务数据抽取、清洗的自动化,采用xgboost算法进行分类算法计算,根据算法计算的结果,对标签等级进行自动划分,生成分类器;
所述预测模块用于根据分类器的模型文件生成对应的预测器,然后通过预测得到原始数据库的各个标签的概率;
所述标签生成模块用于将原始数据库作为输入调用通过预测得到原始数据库的各个标签的概率,然后将对应的标签数据作为对原始数据库的标签。
作为本发明的一种优选技术方案,所述原始数据信息包括线下门店、店员及商品的基础信息和图片信息。
作为本发明的一种优选技术方案,所述数据上传模块包括如下步骤:
步骤一:数据分析人员上传线下门店、店员及商品的基础信息和图片信息作为原始数据信息;
步骤二:将原始数据信息制作成带有相应标签文件的文件夹。
作为本发明的一种优选技术方案,所述数据集生成模块包括如下步骤:
步骤一:将原始数据库生成LMDB格式的训练集和测试集;
步骤二:生成线下门店、店员及商品图片信息的均值文件;
步骤三:将均值文件转化为NUMPY格式;
步骤四:基于MECE原则对训练集和测试集的标签大类进行定义。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳闪回科技有限公司,未经深圳闪回科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110312386.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种纱筒头线吸取检测装置及方法
- 下一篇:一种能够有效隔离高低压线缆的电器盒
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





