天天看点

运维思索:基础设施自动化落地

前言

前面《运维思索》系列文章已经将我们的自动化运维之路铺好,接下来我们要进入的是基础设施自动化落地。本文希望能够将《运维思索》系列与之前分享的一些文章进行有效的串联,让历史文章不再孤单,再次发挥余热。

串联

在运维思索:运维管理与运维自动化一文中讲到了运维自动化的几个阶段:

操作自动化>场景自动化>智能化

,其在基础设施层的落地主要体现为:

  1. 操作自动化

    运维思索:操作系统配置规范化、自动化一文,基于

    配置规范

    结合ansible实现了部分功能的操作自动化:

    (1)操作系统配置初始化、用户配置自动化、安全配置自动化;

    (2)基础组件的自动化部署,如:java、nginx、中间件、python等;

    此阶段

    配置规范

    为核心,ansible、saltstack等自动化工具为辅助工具。
  2. 场景自动化

    基础设施层主要是网络设备、虚拟化集群、物理机等,通过cmdb、堡垒机、监控去管理,因此主要场景有:

    (1)服务器上架,需依次接入cmdb、堡垒机、监控等管理层服务;

    (2)服务器下架,需依次注销cmdb、堡垒机、监控等管理层服务;

    在服务器基数小的情况下,我们可以手动在各个平台注册主机;一旦需要批量上下架,工作量将会指数增长。因此我们需要这些场景自动化来为我们减负。

  3. 智能化

    在此阶段的智能化,我只能联想到故障自愈,与监控平台形成有效联动,实现故障的自动恢复。

在此我们主要介绍场景自动化。

场景自动化

传统的运维核心是以解决孤立的问题为目标,因此当云日趋成熟,让很多运维同学觉得要失业。因为云屏蔽了底层的基础设施,能够让企业将更多的精力放到业务上。转换下思路,运维在企业中是否就是扮演的‘云’的角色,我们要保证的是

  • 业务连续性
  • 资源的快速交付
  • 应用可靠性

因此我们要扮演好’云’的角色,此时就需要依赖操作自动化、场景自动化和智能化三者的互相配合。操作自动化是基础、场景自动化是关键、智能化是保障。因此我们就需要在关键处下手。

基础设施层大部分的工作在于服务器资源的交付,因此运维要保证资源的快速交付,此时就可以靠场景自动化来解决。

  1. 场景一

    基础设施资源一般通过cmdb、jumpserver、vsphere、监控等不同运维工具纳管,我们如何实现服务器资源的一站式交付?

  2. 场景二

    某个业务下架,我们如何从cmdb、jumpserver、vsphere、监控等运维工具中下架关联资产?

以上是两个非常常见的场景,我们该如何实现场景驱动呢?

最佳实践

对于运维来说,通过Web界面输入参数、一键执行实现整个场景的自动化交付,我认为就是最佳实践。

在此特借助蓝鲸标准运维实现了虚拟机交付,实现虚拟机创建、定制ip、jumpserver自动添加资产及用户推送、注册蓝鲸cmdb,发送邮件通知。

我们通过蓝鲸标准运维框架,订制了vsphere、jumpserver、cmdb三个原子,用于打通三个平台,实现了单台虚拟机交付在

1.3 分钟

左右。

1.订制场景流程

运维思索:基础设施自动化落地

2.填写参数

运维思索:基础设施自动化落地

3.一键执行

运维思索:基础设施自动化落地

具体实现可参考以下文章:

蓝鲸智云实现虚拟机交付(一)

蓝鲸智云实现虚拟机交付(二)-虚拟机管理(VSPHERE)

蓝鲸智云实现虚拟机交付(三)-跳板机管理(JUMP)

蓝鲸智云实现虚拟机交付(四)-配置平台自定义(CMDB)

总结

基础设施的管理是运维工作的根本,如果管理混乱,那么上层应用也不好不到哪去。因此运维不管到哪,都要做好场景化的梳理,通过运维流程去定义,做可持续的自动化,保证团队中任何人都可以无缝交接。

继续阅读