[发明专利]云平台自动运维方法、系统、设备及存储介质在审
申请号: | 201710623425.1 | 申请日: | 2017-07-25 |
公开(公告)号: | CN107368365A | 公开(公告)日: | 2017-11-21 |
发明(设计)人: | 周昕毅 | 申请(专利权)人: | 携程旅游信息技术(上海)有限公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F9/455 |
代理公司: | 上海隆天律师事务所31282 | 代理人: | 钟宗,夏彬 |
地址: | 201203 上海市浦东新*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 平台 自动 方法 系统 设备 存储 介质 | ||
技术领域
本发明涉及云服务技术领域,尤其涉及一种基于事件驱动机制自动执行云平台运维任务的云平台自动运维方法、系统、设备及存储介质。
背景技术
云平台是运维基础架构中的重要底层平台,服务器数量众多,平台稳定性要求高,运维管理工作存在很大挑战。云平台管理者需要通过使用自动化运维工具来提升工作效率,进行云平台运维标准化、自动化、流程优化等实践,保障云平台稳定性,降低云平台运维成本。
传统的云平台自动运维工具中包括一些云平台服务管理工具和监控工具等,可以对云平台的运行状态和资源分配等信息进行实时监控,如果发生异常,可以向工程师进行故障告警。工程师在接收到故障告警信息后,可以进行处理。
传统的云平台自动化运维工具主要存在如下三个问题。1)运维操作由工程师主导:传统自动化运维工具需要工程师登录网页界面点击执行相关运维操作,仍然存在误操作的风险。2)开发成本高:工具开发工程师需要收集多个系统的需求,进行工具设计和开发,不同系统的类似功能模块也无法复用,需要重新制定。3)沟通效率低:传统的云平台自动化运维工具之间需要互相配合才能完成运维工作,这就要求云平台管理者熟悉每个不同工具的使用方式,当一个系统事件发生后,需要管理员人工决策如何在另一个系统做相应的处理。例如:当云平台出现宿主机宕机的情况,告警工具会发邮件给负责的运维工程师,运维工程师收到邮件需要登录监控系统查看各类指标,最终决定登录配置管理工具执行重启服务器操作。每次服务器宕机处理过程都是类似的,这也意味着使用传统自动化运维工具的工程师需要进行大量的重复劳动。
发明内容
针对现有技术中的问题,本发明的目的在于提供一种云平台自动运维方法、系统、设备及存储介质,基于事件捕捉和工作流技术实现了事件驱动运维机制,实现了云平台全自动化运维,提高云平台运维效率,节省了工程师的人力操作。
本发明实施例提供一种云平台自动运维方法,所述方法包括如下步骤:
根据多个运维任务建立多个工作流,各个所述工作流包括至少一个所述运维任务和各个所述运维任务的执行序列;
建立所述工作流的触发规则,各个所述工作流的触发规则包括触发该工作流的事件类型;
接收到待处理的运维事件时,判断对应的事件类型,并获取对应的运维事件数据;
根据所述工作流的触发规则,判断所述待处理的运维事件的事件类型触发的工作流;
根据所述运维事件数据和被触发的工作流中的各个运维任务的执行序列,执行被触发的工作流。
可选地,所述运维事件类型包括告警事件,所述告警事件包括宿主机宕机事件、虚拟机宕机事件和资源告警事件。
可选地,所述宿主机宕机事件触发的工作流包括宿主机信息获取任务和宿主机中虚拟机迁移任务;
所述虚拟机宕机事件触发的工作流包括虚拟机信息获取任务和虚拟机中应用迁移任务;
所述资源告警事件触发的工作流包括云平台扩容任务和/或日志清理任务。
可选地,所述宿主机宕机事件所对应的运维事件数据包括宿主机识别码;
所述待处理的运维事件为宿主机宕机事件时,所述执行被触发的工作流包括如下步骤:
执行宿主机信息获取任务,根据所述宿主机识别码查找到发生宕机的宿主机和该宿主机上的虚拟机信息,所述虚拟机信息包括虚拟机识别码和虚拟机中的运行服务;
执行宿主机中虚拟机迁移任务,所述宿主机中虚拟机迁移任务包括如下步骤:
从负载均衡器集群中移除所述虚拟机识别码对应的虚拟机的配置;
在云平台中另一宿主机上重启所述虚拟机识别码对应的虚拟机;
在重启的虚拟机上启动所述运行服务;
调用健康检查接口检查所述运行服务的可用性;
将检查通过的虚拟机重新添加至所述负载均衡器集群。
可选地,所述宿主机宕机事件所对应的运维事件数据还包括云平台资源占用比例;
所述待处理的运维事件为宿主机宕机事件时,所述执行被触发的工作流还包括执行虚拟机迁移方式选择任务,所述虚拟机迁移方式选择任务包括如下步骤:
判断所述云平台资源占用比例是否大于第一预设阈值;
如果是,则选择虚拟机迁移方式为多个虚拟机并行迁移;
否则,选择虚拟机迁移方式为多个虚拟机串行迁移。
可选地,所述虚拟机宕机事件所对应的运维事件数据包括虚拟机识别码;
所述待处理的运维事件为虚拟机宕机事件时,所述执行被触发的工作流包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程旅游信息技术(上海)有限公司,未经携程旅游信息技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710623425.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于铝模板焊接的升降移动式操作平台
- 下一篇:一种检具模具调试基准结构