[发明专利]数据源分析在审
申请号: | 201180069276.X | 申请日: | 2011-03-17 |
公开(公告)号: | CN103430144A | 公开(公告)日: | 2013-12-04 |
发明(设计)人: | 艾哈迈德·伊扎特 | 申请(专利权)人: | 惠普发展公司;有限责任合伙企业 |
主分类号: | G06F9/06 | 分类号: | G06F9/06;G06F9/44;G06F17/30;G06F17/40 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 康泉;宋志强 |
地址: | 美国德*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据源 分析 | ||
技术领域
本发明涉及信息处理,并且更具体地涉及分析。
背景技术
分析是统计和数学建模的应用,以生成关于历史数据的报告或对现有数据进行建模来预测未来。分析横跨计算机科学学科、统计学学科以及数学学科。
附图说明
图1图示用于对组织中的数据源提供分析的示例方法。
图2图示用于提供分析的系统的一个示例。
图3图示用于提供分析的系统的另一示例。
图4图示用于对组织中的数据源提供分析的示例方法。
图5图示能够用于实现图1-图4中图示的系统及方法的计算机系统的示例。
图6图示能够与图1-图4中图示的系统和方法结合使用的集群化计算机系统的示例。
具体实施方式
企业中的信息管理是研究中的新趋势,以通过非结构化数据的添加值使该企业中的结构化数据的值充实。在本发明中,我们提出一种用于对企业中的结构化数据和非结构化数据执行实时分析的模型。在以下描述中,将关系数据库系统(RDBMS)中的结构化查询语言(SQL)数据描述为结构化数据,并且术语“非结构化数据”意在扩展至未根据与结构化数据源关联的组织规划(schema)被结构化的任何数据,并且应当被解读为包括传统的非结构化数据以及半结构化数据。将理解,全文描述应当被解读为包括性的,因此,对特定元素的记载应当被解读为包括包含该元素之一或不止该元素之一的实现。通常,能够将本文描述的系统表现为多个功能组件,能够将每个功能组件实现为被配置为执行其关联功能的硬件和编程的任何合适组合。在所图示的示例中,将每个功能组件描述为存储在非瞬态计算机可读介质上且由关联处理器运行的软件模块,但是将理解,能够使用功能组件的其它实现,例如作为专用硬件或硬件和机器可读指令的结合。
图1图示用于对组织中的数据源提供实时分析的示例方法10。在12处,生成结构化数据源的查询。例如,在分析函数的运行期间能够生成查询,以从关联的企业数据仓库中检索相关数据。在14处,响应于结构化数据源的查询,在联邦(federation)组件处生成非结构化数据源的查询。在一个示例中,联邦组件能够包括位于分析函数本地的统一信息访问层,该统一信息访问层直接从分析函数接收查询。在另一示例中,联邦组件能够包括位于结构化数据源处的表值用户定义函数,并且生成非结构化数据源的查询包括调用表值用户定义函数作为结构化数据源的查询的一部分。在该示例中,表值用户定义函数能够将非结构化数据源的查询的结果映射到虚拟SQL表,以促进将结果返回至分析函数。为进一步简化结果的处理,对表值用户定义函数的调用能够包括与结构化数据源的查询关联的任何谓词(predicate),使得非结构化数据源的查询包括该谓词,并且由该谓词限制所返回的数据。
在16处,合并非结构化数据源的查询的结果和结构化数据源的查询的结果。在一个示例中,统一信息访问层能够简单地将非结构化数据源的查询的结果和结构化数据源的查询的结果合并到单个SQL查询内,以提供至分析函数。在另一示例中,在将这些结果返回至分析函数以前,能够在结构化数据源处经由SQL连接操作将代表结构化数据的查询的结果的SQL表联接至包含非结构化数据源的查询的结果的虚拟SQL表。
在18处,将所合并的结果存储在对于分析函数本地的内存数据库中。该内存数据库维持被标识为与由分析函数执行的分析相关的数据,该数据包括历史数据、结构化数据的增量更新以及从上面描述的联邦组件中提供的实时数据。在20处,运行分析函数,以根据存储在内存数据库中的数据提供代表结构化数据源的内容和非结构化数据源的内容的实时分析输出。在22处,将该实时分析输出显示给用户。
图2图示用于提供实时分析的系统30的一个示例。系统30包括与包括结构化数据源32和非结构化数据源34的一组数据源互连的计算机系统31。计算机系统31包括处理器36以及存储器模块38,并且能够经由通信接口39连接至结构化数据源32和非结构化数据源34。将理解,存储器38能够是可移除的存储器,能够通过诸如光学驱动器、USB端口或其它适合接口之类的合适的端口或驱动器连接至处理器36以及通信接口39。存储器38能够远离处理器36,此时存储在该存储器上的机器可读指令经由通信链接提供至处理器。通信接口36能够包括任何合适的硬件,以与企业中不同的数据源32和34通信。进一步,将理解,被描述作为计算机系统的不局限于单个计算机系统,而是为可扩展目的还能够包括集群化系统。下面提供这样的系统的示例作为图7。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠普发展公司;有限责任合伙企业,未经惠普发展公司;有限责任合伙企业许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180069276.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:在云计算系统中创建资源的技术
- 下一篇:空气调和系统的管理装置