[发明专利]云计算环境下面向不确定数据源的工作流视图构造方法有效

专利信息
申请号: 201210337694.9 申请日: 2012-09-13
公开(公告)号: CN102902739A 公开(公告)日: 2013-01-30
发明(设计)人: 胡海洋;刘占晨 申请(专利权)人: 杭州电子科技大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 杜军
地址: 310018 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 计算 环境 面向 不确定 数据源 工作流 视图 构造 方法
【说明书】:

技术领域

发明属于科学工作流技术领域,涉及一种面向科学工作流不确定数据源的视图构造方法。

背景技术

近年来,随着计算机网络技术飞速发展,作为新型互联网的后端支撑基础云计算技术已开始逐步走向人类社会生活。科学工作流是一类典型的面向海量密集型数据流、以减少计算成本为目标的应用系统,它的出现为跨多类学科和跨不同地域的科研合作提供了方便。在科学工作流系统中,海量数据密集型计算与分布式资源共享彼此间协作、无隙地进行,使得具有不同领域专业知识、地理位置分布的科研工作者可跨组织合作完成相关的科学实验。科学工作流系统现已在各国的科研院所展开应用,并在生物信息学、社会关系分析、气象学、物理学等多个领域都发挥了应有的作用。在云计算环境下进行科学工作流运行时,将产生大量的中间数据和结果,对这些数据进行管理与分析有助于科研工作者对复杂、多步骤的科学实验进行描述和分析。为了保证实验结果的可重复性与可验证性,许多科学工作流系统都提供了对数据源的支持。由于复杂、大规模的科学工作流系统在运行过程中将产生大量的数据源。如何对这些海量的数据源进行有效地查询与管理现已成为科研工作者研究的重要问题之一,目前许多研究工作针对此方面展开,它们通过构造数据源视图的方式来分析数据源,从而达到缩减数据源图的规模和计算复杂度的目的。在数据源视图中,科学工作流中的任务依据数据流关系,被抽象成高阶的复合任务,从而达到隐藏不相关的源数据细节、降低数据源图规模的目的,同时在视图级进行数据查询将有效地提高查询效率。然而由于受数据采集的准确度和服务器的可靠性影响,当对数据源进行数据集成时,工作流数据的不确定性现象将会产生。一般说来,这样的数据不确定性现象可用概率的形式加以量化;在此基础上,不确定科学工作流中的数据源可被定义成活动执行的概率图形式。

目前在科学工作流视图构建技术方面的研究尚未深入,现有工作则主要集中在确定式数据源图方面;而面向不确定式数据源视图的合理性检验与构建技术方面的相关研究工作还有待进一步开展。因此本发明针对此方面进行研究,提出了在不确定数据源图中检测视图合理性的方法,并进一步基于任务间的数据流和局部期望支持度给出了构建不确定式视图的方法。

本发明方法的具体步骤是:

步骤(1)读取科学工作流的数据源图信息,包括数据源图中任务节点集、任务节点间的数据流边的集合和数据流边的存在概率。 

步骤(2)将整个数据源图视为一个完整的工作流视图,检测它的合理性,包括:

①根据数据源图中的每条输入数据流必须能够到达该数据源图的所有输出任务节点这一原则,来检测数据源图的合理性。

②数据源图中的相邻任务节点在满足条件①的情况下能否合并为一个新的复合任务、且新的复合任务存在概率是否小于未合并之前各任务节点的存在概率,如果合并后的新复合任务存在概率大于合并之前各任务节点的存在概率,则认为原来的数据源图具有不合理性。

若数据源图具有合理性,则整个数据源图被视为一个完整的工作流视图。

步骤(3) 若步骤(2)中整个数据源图将作为一个工作流视图被检测为不合理的,则按照以下两种情况重新构造该数据源图的合理性视图:

i)若数据源图因为不符合步骤(2)中的条件①,则对该数据源图按照步骤(4)进行拆分重构,从数据源图里面重新构造出合理性的视图。

ii)若数据源图不符合步骤(2)中的条件②,则找出数据源图中存在那些相邻任务节点:这些相邻任务节点在满足条件①的情况下能合并为一个新的复合任务、且新复合任务存在概率大于未合并之前各任务节点的存在概率,并将这些相邻的任务节点进行合并。

步骤(4)对数据源图进行拆分与重构时,按照如下情形处理:

情形1、对某一任务节点,若它有且仅有一个相邻的前序节点,且该任务节点与该前序节点合并后生成的复合任务的概率期望支持度大于该任务节点及前序节点的概率期望支持度,则该任务节点与其前序节点可以合并为合理的复合任务节点。

情形2、若对于某一任务节点,若它仅有一个相邻的后续节点,且该任务节点与其后续节点合并后生成的复合任务的概率期望支持度大于该任务节点及前序节点的概率期望支持度,则该任务节点可与其后续节点合并为合理的复合任务。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210337694.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top