[发明专利]在分布式集群中的可扩展故障恢复通信有效
申请号: | 201580043261.4 | 申请日: | 2015-08-09 |
公开(公告)号: | CN106663030B | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | A·库玛;A·德阿马托;D·A·迪昂;G·尼沙诺维;L·S·科波鲁;N·马利瓦基 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F9/50 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;杨立 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布式 集群 中的 扩展 故障 恢复 通信 | ||
1.一种在包括至少一个处理器的计算机系统处的用于在节点集群中的计算节点之间传递工作负载更新的计算机实现的方法,所述方法包括:
所述计算机系统标识来自所述节点集群的、已被分配用于托管工作负载配置的工作节点,所述工作负载配置包括被分配给所述工作节点的处理分配;
所述计算机系统从所述工作节点接收包括针对所述工作节点的健康状态以及至少版本标识符,所述版本标识符标识当前被分配给所述工作节点的所述工作负载配置;
所述计算机系统确定在数据分组中接收到的所述版本标识符不同于先前接收到的数据分组的版本标识符;
所述计算机系统至少基于接收到的所述版本标识符来评估所述工作节点的、当前被分配的工作负载配置,以确定是否要对当前被分配给所述工作节点的所述工作负载配置做出处理分配变更;
所述计算机系统确定要对当前被分配给所述工作节点的所述工作负载配置做出处理分配变更;
所述计算机系统确定处理分配变更的集合以发送到所述工作节点;
所述计算机系统选择确定的所述处理分配变更的集合中的子集以发送到所述工作节点;
所述计算机系统生成所选择的处理分配变更的所述子集以分配分组的形式发送到所述工作节点的指示,所述分配分组与所选择的所述子集基于带宽限制来组合以避免超过用于传送所述分配分组的协议的预定的最大传输单元;以及
所述计算机系统向所述工作节点发送所述分配分组,包括所述工作节点更新所述版本标识符的指示,导致当前被分配给所述工作节点的所述处理分配和所述版本标识符两者在所述工作节点处被更新。
2.根据权利要求1所述的方法,其中所生成的所述分配分组经由容错通信协议被发送到所述工作节点。
3.根据权利要求2所述的方法,其中所述容错通信协议指定由所述计算系统每时间段发送或接收的数据分组的数目的上限。
4.根据权利要求1所述的方法,其中所述处理分配变更包括以下各项中的至少一项:将工作负载添加到所述工作节点、从所述工作节点移除工作负载、或改变所述工作节点上的一个或多个工作负载。
5.根据权利要求1所述的方法,进一步包括:
确定所述带宽限制应用于工作负载变更的所述指示。
6.根据权利要求1所述的方法,其中评估所述工作节点的当前工作负载配置以确定是否要在所述工作节点上做出工作负载变更包括:将所述工作节点的、当前被分配的所述工作负载配置与主节点关于哪些工作负载要由所述工作节点处理的指示进行比较。
7.根据权利要求6所述的方法,其中对所述工作节点所生成的工作负载变更的所述指示包括:在所述工作节点的、当前被分配的所述工作负载配置的指示与所述主节点关于哪些工作负载要由所述工作节点处理的指示之间的差量。
8.根据权利要求1所述的方法,其中带宽限制针对被用于与所述计算系统或所述工作节点通信的每个协议被指定。
9.根据权利要求1所述的方法,其中所生成的工作负载变更的所述指示作为状态查询消息的一部分被发送到所述工作节点。
10.根据权利要求9所述的方法,其中所述状态查询消息以指定的间隔被发送到所述工作节点,所述指定的间隔对应于由所述工作节点正在处理的所述工作负载的优先级。
11.根据权利要求10所述的方法,其中所述状态查询消息被发送到所述工作节点的所述指定间隔根据为所述工作负载指定的所述优先级而动态地改变。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580043261.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于多处理器系统的定向事件信号告知
- 下一篇:工作流执行中系统资源的公平共享