[发明专利]数据稽核系统和方法在审
申请号: | 201611270870.6 | 申请日: | 2016-12-31 |
公开(公告)号: | CN108268549A | 公开(公告)日: | 2018-07-10 |
发明(设计)人: | 姜文平;李彩萍;贺怀宇;吉志刚 | 申请(专利权)人: | 中国移动通信集团湖北有限公司;中国移动通信集团公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04M15/00 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 彭琼 |
地址: | 430023 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 采集 数据源 稽核 数据稽核系统 集群调度 调度 并行处理 采集装置 稽核装置 集群设备 数据采集 线性增长 | ||
1.一种数据稽核系统,其特征在于,包括:
采集装置,用于基于Zookeeper调度集群调度技术,通过分布式的方式对数据源进行采集;
稽核装置,用于对所采集的数据源进行稽核。
2.根据权利要求1所述的系统,其特征在于,所述采集装置包括:第一调度管理器和分布式布置的多个采集应用节点,其中:
所述第一调度管理器,用于为各个采集应用节点分配数据源采集任务;
所述采集应用节点,用于按所述第一调度管理器所分配的采集任务来采集所述数据源。
3.根据权利要求2所述的系统,其特征在于,所述第一调度管理器还用于:
a)获取位于由N个所述数据源所组合的队列中位置n处的采集应用节点p,N是自然数,n的初始值为1;
b)判断所述采集应用节点p是否已经建立ftp连接;
c)查看当前已经建ftp连接的采集应用节点下是否有采集文件,
当有采集文件时,转至d),否则转至e);
d)获得所述数据源下的文件目录列表,针对所述文件目录列表中的每个文件进行采集;
e)将n数加1,判断加1后的n是否小于等于N,
当n≤N时,转至a),否则,将n设置为1,再转至a)。
4.根据权利要求3所述的系统,其特征在于,所述第一调度管理器还用于:
A)根据所述数据源的ID、文件名称将所述采集文件信息写入分布式数据库的采集断点表;
B)从所述文件目录列表中取当前未处理文件的文件名F,从所述数据源中获取文件名为F的文件,并存储至目标目录下;
C)判断所述目标目录下存放文件F的大小是否与所述文件目录列表中的文件大小一致,
当大小一致时,转至D),否则,删除所述目标目录下的文件名为F的文件,并转至B);
D)删除所述数据源中的文件F,更新断点表状态为文件采集完成,并记录完成时间;
E)将当前处理文件F在所述文件目录列表中更新为已处理;
F)判断所述文件目录列表中的所有文件是否都已处理,如果存在未处理的文件则转至B),否则结束本轮采集处理。
5.根据权利要求2所述的系统,其特征在于,所述采集应用节点包括:
传输组件,用于通过传输协议传输所述数据源;
过滤组件,用于将所传输的数据源按预设的过滤规则进行过滤。
6.根据权利要求5所述的系统,其特征在于,所述采集装置还包括:
文件系统,用于分布式存储过滤后的数据源。
7.根据权利要求1-6中任一项所述的系统,其特征在于,所述稽核装置包括:第二调度管理器和分布式布置的多个稽核应用节点,其中:
所述第二调度管理器,用于为各个稽核应用节点分配数据源稽核任务;
所述稽核应用节点,用于按所述第二调度管理器所分配的稽核任务来稽核所述数据源。
8.根据权利要求7所述的系统,其特征在于,所述稽核应用节点包括:
数据归集组件,用于将相同索引标识的数据源进行合并整理;
稽核判断组件,用于对所合并整理的具有相同索引标识的数据源分别进行累加,当所述数据源全部累加完时,分别对所累加得到的数值进行比对。
9.根据权利要求8所述的系统,其特征在于,所述稽核应用节点还包括:
强制稽核组件,用于当预设时间内没有采集到新的数据源时,强制分别对所累加得到的数值进行比对。
10.根据权利要求1-6中任意一项所述的系统,其特征在于,所述数据源包括:在线计费话单、离线话单和在线消息话单。
11.一种数据稽核方法,其特征在于,包括以下步骤:
采集基于Zookeeper调度集群调度技术,通过分布式的方式对数据源进行采集;
对所采集的数据源进行稽核。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团湖北有限公司;中国移动通信集团公司,未经中国移动通信集团湖北有限公司;中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611270870.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于树状图的数据相似度匹配方法及装置
- 下一篇:路径图谱的绘制方法及装置