[发明专利]过滤数据沿袭图有效
| 申请号: | 201680009992.1 | 申请日: | 2016-02-10 |
| 公开(公告)号: | CN107430611B | 公开(公告)日: | 2021-12-31 |
| 发明(设计)人: | D·拉迪沃杰维奇 | 申请(专利权)人: | 起元科技有限公司 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F16/26;G06F16/25;G06F16/901;G06Q10/10;G06F16/28 |
| 代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 张浴月;金鹏 |
| 地址: | 美国马*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 过滤 数据 沿袭 | ||
管理沿袭信息包括处理有向图以将多个节点(102、104、106)与用于处理数据沿袭表示请求的信息相关联。处理包括:识别所述有向图中与数据存储器中存储的标准化数据元素对应的一个或多个节点(1362、1364、1366)的第一集合,并将从数据存储器中取回的数据元素去标准化;以及将连接至一个或多个节点的第一集合的第一组多个节点(1370、1372、1374)以及连接至一个或多个节点的第一集合的第二组多个节点(1376、1378、1380)与具有多个可能标签值的至少一个标签标识符相关联,其中可能标签值的数量至少与被标准化后的数据元素的数量一样多,其中在去标准化后的记录中表示不同数据元素的节点与所述标签标识符的不同值关联。
相关申请的交叉引用
本申请要求于2015年2月11日提交的序号为62/114,691的美国申请的优先权。
技术领域
本说明书涉及用于过滤数据沿袭(data lineage)图的沿袭标签。
背景技术
在数据处理系统中,某些类型的用户通常期望能够访问贯穿系统的数据沿袭的视觉表示。这样的“数据沿袭图”可以包括系统中的数据和用于处理该数据实体的图形表示以及它们之间的依赖关系。通常,在许多用途中,可以使用这些数据沿袭图来降低风险,验证合规性义务(regulatory compliance obligation),提高业务流程效率以及保护数据。重要的是数据沿袭图是正确且完整的。
能够产生并显示数据沿袭图的一些系统能够自动呈现端到端的数据沿袭图,这些数据沿袭图示出数据项的表示,并且显示表示了用于消耗或生成这些数据项的处理实体的项的表示。在一些示例中,特定项上游的沿袭路径有时称为该项的“依赖性沿袭(dependency lineage)”,并且特定项下游的沿袭路径有时称为该项的“影响沿袭(impactlineage)”。在其他示例中,特定项上游的沿袭路径被称为“沿袭”或“依赖性”,并且特定项下游的沿袭路径称为“影响”或“影响分析”。如本文所使用的,“数据沿袭图”可以包括相对于任意给定项的上游依赖性沿袭和/或下游影响性沿袭。能够生成并显示数据沿袭图的一些系统允许用户将数据沿袭图中项的逻辑和/或物理组分解成单个元素。能够生成并显示数据沿袭图的一些系统能够通过丰富的数据信息(如数据质量评分)来增强数据沿袭图。
发明内容
在一个方面,通常,一种用于在计算系统中管理沿袭信息的方法,所述方法包括:在数据存储系统中储存有向图的规范,所述有向图的规范包括表示计算的多个节点以及表示在计算执行期间通过计算接收或产生的数据元素的多个节点以及表示计算和数据元素之间的沿袭关系的节点之间的有向链路;使用至少一个处理器处理所述规范,以将多个节点与用于处理数据沿袭表示请求的信息相关联。所述处理包括:识别所述有向图中与数据存储器中存储的标准化数据元素对应的一个或多个节点的第一集合,并将从所述数据存储器中取回的数据元素去标准化,其中将数据元素标准化包括将对应于多个数据元素的记录转换成具有针对至少一个字段的通用格式的多个记录,其中将数据元素去标准化包括将具有针对至少一个字段的通用格式的多个记录转换成对应于多个数据元素的单个记录;以及将通过表示第一沿袭关系的第一有向链路连接至一个或多个节点的所述第一集合的第一组多个节点以及通过表示第二沿袭关系的第二有向链路连接至一个或多个节点的所述第一集合的第二组多个节点与具有多个可能标签值的至少一个标签标识符相关联,其中所述可能标签值的数量至少与被标准化后的数据元素的数量一样多,其中在去标准化后的记录中表示不同数据元素的节点与所述标签标识符的不同值关联。
多个方面可以包括如下特征中的一个或多个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于起元科技有限公司,未经起元科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680009992.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:从分布式数据学习
- 下一篇:查找描述对计算问题的解决方案的文档
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





