[发明专利]数据库的数据样本采集有效
申请号: | 201410182652.1 | 申请日: | 2014-05-04 |
公开(公告)号: | CN105095240B | 公开(公告)日: | 2018-11-27 |
发明(设计)人: | 马军;尹祥龙;李岭 | 申请(专利权)人: | 中国银联股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 唐立;汤春龙 |
地址: | 200135 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库 数据 样本 采集 | ||
1.一种数据样本采集方法,其特征在于,包括以下步骤:
提供多条可配置的数据样本采集规则;
提供被采集的目标数据库以确定源数据;
对所述目标数据库进行源数据的扫描搜索;
解析多条所述数据样本采集规则,并且基于解析的多条所述数据样本采集规则对每条数据进行以下数据筛选处理过程:
判断每条数据是否满足每条数据样本采集规则以获得每条数据的规则满足情况,
判断每条数据的规则满足情况是否在用于记录数据样本的目的表中相应存在,如果判断为“是”则不采集该条数据至所述目的表,如果判断为“否”则该条数据被判断为需要采集的数据并被更新存储到所述目的表中,该条数据的相应规则满足情况也被更新存储到所述目的表中;
对所述目的表中存储的规则满足情况进行统计;以及
基于所述统计的结果,对所述目的表的当前数据样本进行显示,从而可操作地基于所述显示判断相应的数据样本采集规则是否需要进行调整配置。
2.如权利要求1所述的方法,其特征在于,在所述数据筛选处理过程中,采用数据内存分块方法来将所述源数据依次写入到共享内存的K块数据区中,K为大于或等于2的整数。
3.如权利要求2所述的方法,其特征在于,在判断判断每条数据的规则满足情况步骤中,使用内存字段定位法来确定某条数据的对应某一条数据样本采集规则的规则字段值在所述共享内存所对应的内存地址的字段值,从而将该内存地址的字段值与对应的数据样本采集规则进行比较判断;
其中,在所述内存字段定位法中,通过源表的格式,得出每个规则字段的长度值l,以及计算出每个规则字段从每条数据首字节的偏移量O和每条记录的长度值L,假设正在处理中的共享内存数据区的首地址为A,那么规则对应的每个字段在共享内存中进行匹配的时候,第y条记录的规则字段的规则字段值等于在A+O+L*(y-1)内存地址开始取l长度所获得的值。
4.如权利要求1所述的方法,其特征在于,所述源数据被存储目标数据库的一张或多张源表中。
5.如权利要求1或2或4所述的方法,其特征在于,在解析所述数据样本采集规则的步骤中,对所述数据样本采集规则进行初始化,从而将其转化成便于判断一条数据中一个或多个字段是否匹配的规则;其中,被初始化的数据样本采集规则被存入共享内存中。
6.如权利要求4所述的方法,其特征在于,从数据库对所述源表进行索引获取和格式分析。
7.如权利要求6所述的方法,其特征在于,将对所述源表的索引与数据样本采集规则进行比较判断;如果存在数据样本采集规则与所述索引相一致,则在搜索所述源表的源数据时使用与所述索引相一致的所述数据样本采集规则作为搜索条件;如果不存在数据样本采集规则与所述索引相一致,则顺序扫描整个源表以搜索所述源表的源数据。
8.如权利要求2或3所述的方法,其特征在于,根据所述源数据的条数以及共享内存中每块数据区可容纳的数据条数,计算源数据的数据分块数量。
9.如权利要求2或3所述的方法,其特征在于,在共享内存的每块数据区的源数据写入完毕后,对该数据区的每条数据的规则满足情况进行判断。
10.如权利要求9所述的方法,其特征在于,以多进程并发方式进行规则满足情况的判断。
11.如权利要求9所述的方法,其特征在于,在所述判断每条数据的规则满足情况是否在所述目的表中相应存在的步骤中,按所述数据区的分块依次进行;并且在某一数据区的每条数据的规则满足情况的判断结束后,判断该块数据区的每条数据的规则满足情况是否在所述目的表中相应存在。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410182652.1/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置