[发明专利]大数据整合处理方法、系统和存储介质在审
申请号: | 202110986171.6 | 申请日: | 2021-08-26 |
公开(公告)号: | CN113779144A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 朱潇婷;张娟琦;张朝明;曾志华;黄家昌;王钎;张金鸿;田震琪 | 申请(专利权)人: | 深圳市惟客数据科技有限公司 |
主分类号: | G06F16/27 | 分类号: | G06F16/27;G06F16/2458;G06F16/25;G06F16/28;G06F40/186 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 张志辉 |
地址: | 518000 广东省深圳市南山区粤海街道海珠社区海德*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 整合 处理 方法 系统 存储 介质 | ||
本发明公开了一种大数据整合处理方法、系统和存储介质。该方法包括以下步骤:响应于数据获取请求,通过埋点分析,获取目标数据,并存储在消息队列中;响应于数据同步请求,利用异构数据源数据同步方法,将目标数据从消息队列同步至目标数据库;当目标数据同步完成,利用数据拉通方法,从目标数据库中提取每一份待处理数据的所有用户标识,并根据用户标识,关联所有待处理数据,得到关联结果;根据关联结果和预设的第一模板文件,生成目标表;根据目标表,配置并生成元数据。本发明公开的一种大数据整合处理方法、系统和存储介质,使用户可以通过元数据对记载在目标表上的准确率更高的数据进行查询和分析,有利于提高查询和分析的准确率。
技术领域
本发明涉及数据处理技术领域,特别涉及一种大数据整合处理方法、系统和存储介质。
背景技术
随着互联网的发展,客户数据平台应运而生。该客户数据平台用于提供客户数据,以便于企业对该客户数据进行分析。但是,目前的分析方法只是利用客户数据平台对该客户数据进行固定维度的分析,分析方式较为单一,且客户数据样本较少,得到的分析结果不够准确,导致企业依据该分析结果进行营销时,效果不佳。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种大数据整合处理方法,能够提高数据分析的准确度。
本发明还提出一种大数据整合处理系统。
本发明还提出一种包括上述大数据整合处理方法的存储介质。
根据本发明第一方面实施例的大数据整合处理方法,包括以下步骤:响应于数据获取请求,通过埋点分析,获取目标数据,并存储在消息队列中;响应于数据同步请求,利用异构数据源数据同步方法,将所述目标数据从所述消息队列同步至目标数据库;当所述目标数据同步完成,利用数据拉通方法,从所述目标数据库中提取每一份待处理数据的所有用户标识,并根据所述用户标识,关联所有所述待处理数据,得到关联结果;根据所述关联结果和预设的第一模板文件,生成目标表;根据所述目标表,配置并生成元数据。
根据本发明实施例的大数据整合处理方法,至少具有如下有益效果:通过埋点分析获取目标数据,目标数据包括一方数据、二方数据和三方数据,即多方的目标数据,再通过异构数据源数据同步方法将目标数据同步至目标数据库,目标数据同步至目标数据库后,即为待处理数据,以便于后续处理;利用数据拉通方法,将目标数据库中的待处理数据进行关联,得到关联结果,以便于将来源不同的各个待处理数据建立联系;而根据关联结果和预设的第一模板文件,生成目标表,该目标表记录了多方的目标数据,并根据目标表配置元数据,以便于后续对整理好的数据进行查询。通过大数据整合处理方法,获取多方目标数据,并将多方目标数据同步并建立联系,且配置元数据以实现快速查询,有利于通过元数据对记录在目标表上的多方目标数据进行多个维度的查询和分析,有利于提高分析的准确度。
根据本发明的一些实施例,所述当所述目标数据同步完成,利用数据拉通方法,从所述目标数据库中提取每一份待处理数据的所有用户标识,并根据所述用户标识,关联所有所述待处理数据,得到关联结果,包括以下步骤:当所述目标数据同步完成,根据预设的标识类型,从所述目标数据库中提取每一份所述待处理数据的所有所述用户标识;根据所述用户标识及预设的关联规则,关联具有相同所述用户标识的所有所述待处理数据,得到所述关联结果。
根据本发明的一些实施例,所述当所述目标数据同步完成,利用数据拉通方法,从所述目标数据库中提取每一份待处理数据的所有用户标识,并根据所述用户标识,关联所有所述待处理数据,得到关联结果,包括以下步骤:当所述目标数据同步完成,利用IDmapping方法,从所述目标数据库中提取每一份所述待处理数据的所有所述用户标识;根据所有所述用户标识,生成用于图计算的点集合与边集合;根据所述点集合与所述边集合,生成并得到构造图;根据所述构造图,利用最大连通子图算法计算得到所述关联结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市惟客数据科技有限公司,未经深圳市惟客数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110986171.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置