[发明专利]大数据背景下数据埋点准确性校验的解决方案在审
| 申请号: | 202111207330.4 | 申请日: | 2021-10-15 |
| 公开(公告)号: | CN113900948A | 公开(公告)日: | 2022-01-07 |
| 发明(设计)人: | 薛鹏;于红建;苏松林 | 申请(专利权)人: | 北京同城必应科技有限公司 |
| 主分类号: | G06F11/36 | 分类号: | G06F11/36;G06F9/54 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100085 北京市海淀区永泰*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据 背景 准确性 校验 解决方案 | ||
本发明公开了大数据背景下数据埋点准确性校验的解决方案,包括埋点数据准确性的自动化校验;埋点数量的准确性校验;埋点数据准确性的自动化校验:用户配置需校验数据字段的校验规则后,程序通过Flink实时处理进行匹配,并将处理结果落地到Apache Druid库中以供展示。埋点数量的准确性校验:用户设置校验规则后,程序通过Flink窗口将″前端″,″网关″,″后台″及查询DB数量进行比对,并将处理结果落地到Apache Druid库中以供展示。
所属技术领域
本专利涉及一种在大数据背景下数据埋点准确性校验的解决方案,属于互联网技术领域。
背景技术
数据埋点是一种网站分析的常用数据采集方法,具有良好的私有化部署特点。联合公司工程、ETL采集分析用户全量行为,建立用户画像,还原用户行为模型,可作为产品分析、优化的基础。
但因手动埋点工程量极大,且一不小心容易出错,成为很多工程师的痛。所以本发明基于此提供了一种在大数据背景下数据埋点准确性校验的解决方案。
发明内容
本发明的主要目的在于提供一种在大数据背景下数据埋点准确性校验的解决方案。
为达到上述目的,本发明采用以下技术方案:
埋点准确性校验:用户通过在管理服务配置需校验数据字段的校验规则,定时任务扫描待执行的校验任务并将放入Redis中通知Flink进行流式处理,Flink有两个数据源,一个是从消息中间件中读出来的埋点消息,另一个就是Redis中的任务开始通知。Flink根据校验规则对从消息中间件中取出来的埋点消息进行对比,并将结果存储到ApacheDruid。管理服务通过读取Apache Druid中的校验结果数据进行展示。
埋点数量校验:用户通过在管理服务配置数量校验规则,前端埋点和网关埋点数量进行对比,后台埋点数量和DB的数量进行对比。定时任务扫描待执行的校验任务并将放入Redis中通知Flink进行流式处理,Flink有两个数据源,一个是从消息中间件中读出来的埋点消息,另一个就是Redis中的任务开始通知。Flink根据校验规则对从消息中间件中取出来的埋点消息进行对比,此处并不实时落库,还需利用Flink的窗口机制统计一段时间的数量,并将数量存储在Apache Druid。管理服务通过读取Apache Druid的校验数量进行展示。
附图说明
图1:部署架构图。
图2:任务启动流程图。
图3:任务终止流程图。
具体实施方式
下面将结合发明实例中的附图,对本发明实例中的技术方案进行清楚、完整地描述。本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种在大数据背景下数据埋点准确性校验的解决方案。
所属的方案包括如下步骤:
埋点准确性校验:
步骤一:用户通过在管理服务配置需校验数据字段的校验规则,包含“项目”、“平台”、“来源”,“任务开始/结果时间”以及“事件规则”等。
步骤二:定时任务扫描待执行的校验任务并将放入Redis中通知Flink进行流式处理,任务通知使用Redis的zset数据结构来存放有效任务,任务详情通过Redis的String数据结构来存放包含步骤一配置的任务信息。
步骤三:Flink流式处理,从消息中间件中读取埋点流信息,并将redis的任务开始及详细信息配置为广播流,对比埋点流信息和redis中的任务信息。
步骤四:将步骤三中的数据对比结果存储到Apache Druid中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京同城必应科技有限公司,未经北京同城必应科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111207330.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





