[发明专利]一种基于跨境电商平台的大数据用户挖掘方法及系统在审

专利信息
申请号: 202010655660.9 申请日: 2020-07-09
公开(公告)号: CN111815358A 公开(公告)日: 2020-10-23
发明(设计)人: 谭紫威 申请(专利权)人: 湖南数客星球信息技术有限公司
主分类号: G06Q30/02 分类号: G06Q30/02;G06Q30/06;G06F40/30;G06F40/284;G06N20/00
代理公司: 长沙科永臻知识产权代理事务所(普通合伙) 43227 代理人: 杨琦玲
地址: 410000 湖南省长沙市高新开发区麓谷*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 跨境电商 平台 数据 用户 挖掘 方法 系统
【说明书】:

发明公开的一种基于跨境电商平台的大数据用户挖掘方法及系统,包括数据处理模块、数据统计模块、模型构建模块和数据可视化模块,借助大数据分析应用,结合机器学习、统计学等方法对大数据进行数据处理,实现数据可视化、数据智能化以及数据决策的赋能,达到完美精准营销,充分挖掘产品的不足,精进产品,降低人工成本,降低耗时,提高准确度。

技术领域

本发明属于大数据应用分析技术领域,具体涉及一种基于跨境电商平台的大数据用户挖掘方法及系统。

背景技术

现在处于信息过载的时代,越来越多的数据和信息,人力是很难做到及时、精准、全面的了解到一个市场的消费者用户的需求的,而且人看到数据、处理数据都是片面的,在面对平台量级的数据时,由于人模糊的过往经验,无法在读取评论信息时准确的进行信息提取和数据整理,并且人力处理的时效性差、成本高、准确率低。

发明内容

(一)解决的技术问题

针对现有技术的不足,本发明提供一种基于跨境电商平台的大数据用户挖掘方法及系统,借助大数据能够准确的提取信息、整理数据、时效性高、耗时短、成本较低、准确率高。

(二)技术方案

为实现以上目的,本发明通过以下技术方案予以实现:一种基于跨境电商平台的大数据用户挖掘方法,包括以下步骤:

S1、从跨境电商平台的公开数据中获取产品的评论信息,将所述评论信息按照购买时间、购买尺码、购买颜色、评论内容以及产品评分分别建立文本信息的集合;

S2、对所述购买时间集合、购买尺寸集合以及购买颜色集合进行初步筛选,剔除文本信息中的缺失值,并对初步筛选后的文本信息进行格式统一化;

S3、对统一化后的购买时间集合、购买尺寸集合以及购买颜色集合进行数理统计,分别提取购买时间集合、购买尺寸集合以及购买颜色集合的唯一值建立购买时间子集、购买尺寸子集以及购买颜色子集,依次对所有的购买时间子集、购买尺寸子集以及购买颜色子集进行数据统计,从而得到相对应的购买时间数据子集、购买尺寸数据子集以及购买颜色数据子集,购买尺寸子集与对应的购买尺寸数据子集、购买时间子集与购买时间数据子集、购买颜色子集与购买颜色数据子集进行数据分析;

S4、对所述产品评分集合按不同分数段划分为多个产品评分子集,并对其进行数据统计,从而得到相对应的产品评分数据子集,对所有的产品评分子集与对应的产品评分数据子集进行数据分析;

S5、对所述评论内容集合进行迭代筛选,剔除重复的文本信息,并对评论内容集合中连续重复的语料语句进行机械压缩;

S6、对S5中得到的文本信息利用结巴分词的方法进行分词,剔除停用词;

S7、对S6中得到的文本信息进行进一步分析,根据语义分为正面子集和负面子集,实现关系可视化;

S8、利用LDA模型进行主题分析;

S9、对模型进行人工评估并判断是否需要进行优化处理。

进一步的,所述步骤S2中文本信息的缺失值为空的数据字段。

进一步的,所述步骤S3中将购买尺寸子集与对应的购买尺寸数据子集、购买时间子集与购买时间数据子集、购买颜色子集与购买颜色数据子集按照正态分布中间高、两端低的分布方式得到购买尺寸与购买尺寸数据的数理关系,对数据进行数据分析中分析方法数据可视化。

进一步的,所述步骤S4中对数据进行数据分析中占比分析方法数据可视化。

进一步的,所述步骤S5中重复的文本信息通常为默认评论,并对评论内容集合中单条评论内容进行数据句中去重,机械压缩单条评论内容中连续重复的语料语句。

进一步的,所述步骤S6中停用词为人工设定。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南数客星球信息技术有限公司,未经湖南数客星球信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010655660.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top