[发明专利]删除中间层数据的方法、系统和装置有效
申请号: | 201610384293.7 | 申请日: | 2016-06-01 |
公开(公告)号: | CN107463555B | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 颜博 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/28;G06F16/21 |
代理公司: | 北京成创同维知识产权代理有限公司 11449 | 代理人: | 蔡纯;张靖琳 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 删除 中间层 数据 方法 系统 装置 | ||
本发明提供了一种删除中间层数据的方法、系统和装置,其中,所述方法包括:在执行数据加工任务时,根据数据血缘关系,建立具有多个节点的数据血缘关系树型结构图;根据所述血缘关系树型结构图,建立节点之间的父子关系表;记录数据加工完成日志,所述日志至少包括一个或多个完成节点;分析所述数据加工完成日志的完成节点,根据所述完成节点,从所述父子关系表中查询得到所述完成节点的父节点;根据所述父节点查询所述数据加工完成日志;判断所述数据加工完成日志中是否包含了所述完成节点的父节点,如果包含,删除所述完成节点的数据,并从所述数据加工完成日志中删除所述完成节点。本发明在数据加工过程中自动删除中间层数据,释放资源。
技术领域
本发明涉及数据处理技术领域,具体地说,涉及一种在复杂数据加工中,删除中间层数据的方法、系统和装置。
背景技术
在数据仓库、大数据(Big Data)等复杂的数据加工场景中,在将原始数据加工成目标数据的过程中,需要经过若干个中间加工步骤。在加工的过程中,除了数据源与结果数据以外,还会生成各种中间数据,业界通常称之为中间层。
中间层虽然是组成复杂数据加工的一个重要层次,然而,中间层除了利于数据的加工与计算,本身存在的价值并不大,反而会加大数据建设的开销,增加存储与管理成本。如果在数据加工中能删除中间层中不再使用的数据,将为企业节省一大笔用于存储数据的开销,从而减低企业的运营成本。
传统的复杂数据加工遵循逐层加工原则,对数据分层次进行加工,并保留中间加工过程的数据。在部分具体的场景中,当判断中间层已经不再使用时,在加工完成之后,手动在程序里添加数据删除的代码,从而完成中间层的数据删除。
由于大部分时候保留中间层数据,这种情形会导致大量的数据冗余,并且增加中间层模型的管理成本。对于目前删除中间层数据的方法,需要在程序中手动添加删除代码,不够灵活,并且增加了程序维护成本。
发明内容
本发明要解决的技术问题在于,针对现有技术中的不足,提供一种在复杂数据加工中删除中间层数据的方法、系统和装置,在数据加工完成之后自动删除中间层数据,释放资源。
为了解决上述技术问题,根据本发明的一个方面,本发明提供了一种删除数据加工时产生的中间层数据的方法,其中,包括:
在执行数据加工任务时,根据数据血缘关系,建立具有多个节点的数据血缘关系树型结构图;
根据所述血缘关系树型结构图,建立节点之间的父子关系表;
记录数据加工完成日志,所述日志至少包括一个或多个完成节点;
分析所述数据加工完成日志的完成节点,根据所述完成节点,从所述父子关系表中查询得到所述完成节点的父节点;
根据所述父节点查询所述数据加工完成日志;
判断所述数据加工完成日志中是否包含了所述完成节点的父节点,如果包含,删除所述完成节点的数据,并从所述数据加工完成日志中删除所述完成节点。
优选地,所述数据加工完成日志还包括完成节点对应的完成时间。
优选地,所述分析所述数据加工完成日志的完成节点的步骤包括:
按完成节点的完成时间,从完成时间最早的完成节点开始分析。
优选地,血缘关系树型结构图包括多个代表源数据的叶子节点、多个代表中间层数据的中间节点和一个代表目标数据的根节点;
所述数据节点加工完成日志中的完成节点为中间节点或根节点。
优选地,从所述父子关系表中查询所述完成节点的父节点之前,判断所述完成节点是否为根节点,如果不是根节点,查询所述完成节点的父节点,如果是根节点,结束对该完成节点的分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610384293.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:面盆水龙头(II型)
- 下一篇:智能锁(4)
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置