[发明专利]大数据背景下数据埋点准确性校验的解决方案在审

专利信息
申请号: 202111207330.4 申请日: 2021-10-15
公开(公告)号: CN113900948A 公开(公告)日: 2022-01-07
发明(设计)人: 薛鹏;于红建;苏松林 申请(专利权)人: 北京同城必应科技有限公司
主分类号: G06F11/36 分类号: G06F11/36;G06F9/54
代理公司: 暂无信息 代理人: 暂无信息
地址: 100085 北京市海淀区永泰*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 背景 准确性 校验 解决方案
【说明书】:

本发明公开了大数据背景下数据埋点准确性校验的解决方案,包括埋点数据准确性的自动化校验;埋点数量的准确性校验;埋点数据准确性的自动化校验:用户配置需校验数据字段的校验规则后,程序通过Flink实时处理进行匹配,并将处理结果落地到Apache Druid库中以供展示。埋点数量的准确性校验:用户设置校验规则后,程序通过Flink窗口将″前端″,″网关″,″后台″及查询DB数量进行比对,并将处理结果落地到Apache Druid库中以供展示。

所属技术领域

专利涉及一种在大数据背景下数据埋点准确性校验的解决方案,属于互联网技术领域。

背景技术

数据埋点是一种网站分析的常用数据采集方法,具有良好的私有化部署特点。联合公司工程、ETL采集分析用户全量行为,建立用户画像,还原用户行为模型,可作为产品分析、优化的基础。

但因手动埋点工程量极大,且一不小心容易出错,成为很多工程师的痛。所以本发明基于此提供了一种在大数据背景下数据埋点准确性校验的解决方案。

发明内容

本发明的主要目的在于提供一种在大数据背景下数据埋点准确性校验的解决方案。

为达到上述目的,本发明采用以下技术方案:

埋点准确性校验:用户通过在管理服务配置需校验数据字段的校验规则,定时任务扫描待执行的校验任务并将放入Redis中通知Flink进行流式处理,Flink有两个数据源,一个是从消息中间件中读出来的埋点消息,另一个就是Redis中的任务开始通知。Flink根据校验规则对从消息中间件中取出来的埋点消息进行对比,并将结果存储到ApacheDruid。管理服务通过读取Apache Druid中的校验结果数据进行展示。

埋点数量校验:用户通过在管理服务配置数量校验规则,前端埋点和网关埋点数量进行对比,后台埋点数量和DB的数量进行对比。定时任务扫描待执行的校验任务并将放入Redis中通知Flink进行流式处理,Flink有两个数据源,一个是从消息中间件中读出来的埋点消息,另一个就是Redis中的任务开始通知。Flink根据校验规则对从消息中间件中取出来的埋点消息进行对比,此处并不实时落库,还需利用Flink的窗口机制统计一段时间的数量,并将数量存储在Apache Druid。管理服务通过读取Apache Druid的校验数量进行展示。

附图说明

图1:部署架构图。

图2:任务启动流程图。

图3:任务终止流程图。

具体实施方式

下面将结合发明实例中的附图,对本发明实例中的技术方案进行清楚、完整地描述。本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供了一种在大数据背景下数据埋点准确性校验的解决方案。

所属的方案包括如下步骤:

埋点准确性校验:

步骤一:用户通过在管理服务配置需校验数据字段的校验规则,包含“项目”、“平台”、“来源”,“任务开始/结果时间”以及“事件规则”等。

步骤二:定时任务扫描待执行的校验任务并将放入Redis中通知Flink进行流式处理,任务通知使用Redis的zset数据结构来存放有效任务,任务详情通过Redis的String数据结构来存放包含步骤一配置的任务信息。

步骤三:Flink流式处理,从消息中间件中读取埋点流信息,并将redis的任务开始及详细信息配置为广播流,对比埋点流信息和redis中的任务信息。

步骤四:将步骤三中的数据对比结果存储到Apache Druid中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京同城必应科技有限公司,未经北京同城必应科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111207330.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top