[发明专利]应用的托管进程进行迁移的方法及装置在审
| 申请号: | 201710908817.2 | 申请日: | 2017-09-29 |
| 公开(公告)号: | CN109582459A | 公开(公告)日: | 2019-04-05 |
| 发明(设计)人: | 陈钢 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06F9/50 | 分类号: | G06F9/50 |
| 代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 孙敬霞;栗若木 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 托管 机器节点 新资源 进程 目标机器 迁移 应用 节点启动 进程分配 托管应用 释放 申请 分配 成功 | ||
一种应用的托管进程进行迁移的方法及装置,包括:确定对当前机器节点的应用的托管进程进行迁移时,在目的机器节点为所述托管进程分配新资源;在所述目标机器节点,基于分配的新资源启动所述托管进程;所述托管进程在所述目标机器节点启动成功后,释放所述托管进程在所述当前机器节点上占有的资源。本申请至少能够避免旧资源已释放而新资源又申请不下来的情况,可提高托管应用的稳定性。
技术领域
本发明涉及计算机应用技术领域,尤其涉及一种应用的托管进程进行迁移的方法及装置。
背景技术
一个大型的分布式资源调度系统通常管理着成千上万台机器节点,每一台机器节点可作为一个资源节点提供物理资源。用户可通过分布式资源调度系统提供的协议或者客户端与集群进行交互,完成资源申请、以及应用的自动化部署/运行工作。然而由于集群规模巨大,在集群上运行的应用种类复杂,数量繁多,通常会由于资源隔离不完善、机器宕机、硬件损坏、网络抖动以及应用自身问题等原因而造成应用运行异常,这就需要将所述应用的托管进程快速地迁移到集群中其他正常机器节点中。
目前,托管进程的迁移是先将托管进程占用的资源释放,再为该托管进程申请新资源并重新部署。异常进程已占有资源被释放后,无法保证当前集群有新资源可供分配和使用,很可能会出现旧的资源已经释放而新资源又由于种种原因申请不下来的情况,而一旦出现这种情况,相当于用户应用被迫缩容,不但增加了用户使用集群的成本,还会造成线上服务中断。
此外,相关技术中托管进程的迁移要么是用户触发要么是资源调度系统主动触发,触发模式单一,某些应用运行异常的情况无法及时感知,导致托管进程的迁移滞后,从而造成应用服务长时间不可用,严重影响用户体验。
发明内容
本申请旨在至少解决相关技术中的技术问题之一。
本申请提供一种应用的托管进程进行迁移的方法及装置,至少能够避免旧资源已释放而新资源又申请不下来的情况。
本申请采用如下技术方案:
一种应用的托管进程进行迁移的方法,包括:
确定对当前机器节点的应用的托管进程进行迁移时,在目的机器节点为所述托管进程分配新资源;
在所述目标机器节点,基于分配的新资源启动所述托管进程;
所述托管进程在所述目标机器节点启动成功后,释放所述托管进程在所述当前机器节点上占有的资源。
其中,所述在目的机器节点为所述托管进程分配新资源之前,还包括:所述当前机器节点检测到自身物理资源异常时,触发所述托管进程的迁移;根据来自客户端的迁移消息,触发托管进程的迁移,所述迁移消息中携带所述托管进程的标识。
其中,所述物理资源异常包括如下之一或多项:
宕机;
网络抖动;
硬件损坏。
其中,在基于分配的新资源启动所述托管进程之前,还包括:将所述当前机器节点上所述托管进程的本地临时数据同步至所述目标机器节点。
其中,将所述当前机器节点上所述托管进程的本地临时数据同步至所述目标机器节点,包括:将所述当前机器节点上所述托管进程的本地临时数据拷贝至共享存储文件系统,再从所述共享存储文件系统中将所述托管进程的本地临时数据拷贝至所述目标机器节点。
其中,所述释放所述托管进程在当前机器节点上占有的资源之后,还包括:将所述当前机器节点上所述托管进程的本地临时数据删除。
其中,所述基于分配的新资源启动所述托管进程之后,还包括:所述托管进程在所述目标机器节点启动失败时,自动回滚。
其中,所述自动回滚包括如下之一或多项:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710908817.2/2.html,转载请声明来源钻瓜专利网。





