[发明专利]一种松耦合的分布式工作流协调系统和方法在审
| 申请号: | 202111061941.2 | 申请日: | 2021-09-10 |
| 公开(公告)号: | CN113821322A | 公开(公告)日: | 2021-12-21 |
| 发明(设计)人: | 刘媛媛;陈廷梁 | 申请(专利权)人: | 浙江数新网络有限公司 |
| 主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F9/50;G06F9/54 |
| 代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
| 地址: | 311121 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 耦合 分布式 工作流 协调 系统 方法 | ||
本发明公开了一种松耦合的分布式工作流协调系统和方法,用户通过调用接口服务API,对工作流进行定义、上线和运维等;分布式工作流协调器Coordinator通过集成分布式定时引擎Quartz,来定时调度工作流并添加到工作流派发分布式消息队列MQ,接收工作流并处理其任务依赖关系,将协调后待执行的业务型任务添加到任务派发分布式消息队列MQ;分布式任务执行器Worker从任务派发分布式消息队列MQ中接收各业务型任务并执行,将任务执行结果通过任务回调分布式消息队列MQ回调至分布式工作流协调器Coordinator;最后Coordinator将任务执行结果持久化保存到数据库,用于反馈用户。本发明将Coordinator专注于逻辑协调处理,保证工作流协调处理与任务执行充分解耦,提升系统的吞吐量、扩展性以及伸缩性。
技术领域
本发明涉及大数据开发处理技术领域,具体来说,涉及一种松耦合的分布式工作流协调系统和方法。
背景技术
在数据开发项目中,通常需要制定若干工作流(以任务为节点,满足依赖关系的DAG),每个工作流按照相应的定时(Cron表达式),进行周期性的执行;此类业务通常通过工作流调度系统来实现。
传统工作流调度系统通常由:API接口服务、Manager工作流管理器、Worker任务执行器、RDBMS数据存储。
API接口服务:负责工作流及其任务的创建、定时的创建以及工作流定时的上线;
Manager管理器:负责工作流的定时执行、工作流DAG转任务线性队列、任务队列执行上下文管理、任务派发给对应的worker、任务执行结果回调监听、任务状态判断和后续任务派发;
Worker任务处理器:负责各类业务型任务的执行。
RDBMS数据库存储:负责工作流元数据存储、工作流派发队列;
传统架构的弊端:
Manager在处理工作流及其任务队列时不支持优先级排序,对于无明确先后关系的工作流或任务的线性顺序是随机的,调度不够精确;
Manager与Worker耦合度高,不利于系统扩展和维护;
Manager内存管理大量工作流实例及其任务队上下文,资源消耗大,系统吞吐量受限;另外因为工作流上下文是缓存在Manager实例内部的,所以一个工作流实例只能在一个Manager实例内部完成,Manager的分布式处理粒度限制于工作流实例。
发明内容
本发明目的在于针对现有技术的不足,提出一种松耦合的分布式工作流协调方法和系统,将Coordinator专注于逻辑协调处理,保证工作流协调处理与任务执行充分解耦,提升系统的吞吐量、扩展性以及伸缩性。
本发明的目的是通过以下技术方案来实现的:一种松耦合的分布式工作流协调系统,该系统包括:接口服务API,分布式工作流协调器Coordinator,分布式任务执行器Worker,高可用缓存Cache,分布式消息队列MQ,数据库RDBMS和分布式协调服务Zookeeper。
所述接口服务API通过Zookeeper来监控分布式工作流协调器Coordinator和分布式任务执行器Worker的服务情况;
所述分布式消息队列MQ包括工作流派发分布式消息队列MQ(workflow-MQ)、任务派发分布式消息队列MQ(task-dispatch-WorkerGroup-MQ)和任务回调分布式消息队列MQ(task-callback-MQ);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江数新网络有限公司,未经浙江数新网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111061941.2/2.html,转载请声明来源钻瓜专利网。





