构建自动化运维体系的三大层级
IT 运维的工作重点之一,即对软硬件资源的生命周期进行全方位管理,不同的资源有不同的管理方式,而自动化运维的理想做法就是用平台化运维来代替人工运维,结果就导致我们可能需要很多基础运维服务来进行资源操作,那么最好的做法就是将运维能力服务化并通过运维门户来集成各个服务,从而对外提供统一的入口。
自动化运维体系自上而下可分为三层,依次是前台接入层、中台能力层、后台资源层。
1、前台接入层
接入层要满足的需求重点包括运维门户、流程管理以及服务运营。
运维门户来讲,主要的作用和关键属性在于提供统一的入口来进行能力输出,其本身并不具备自动化的能力,需要通过对接相关的运维服务,最终实现对各项资源的自动化运维操作。
流程管理最主要的关注点在于协调人和自动化运维服务,让需求的处理变得更加规范和高效,降低沟通成本。自动化运维服务和流程管理平台的对接,会让自动化的程度有较大的提升。
服务运营平台主要包括事件管理、事故管理、问题管理以及知识库。事件管理主要通过对接监控平台来进行统一的事件存储、分析、告警去重、降噪等,事故管理是对生产事故的记录,问题管理和知识库主要用来提供更好的运维服务。
2、中台能力层
中台能力层主要包含面向各种运维场景的运维服务,例如针对应用部署的场景,通过自动化发布,能够实现对应用的一键部署、回滚、启停。针对虚拟机管理的场景,通过虚拟机管理平台,能够实现虚拟机的批量新增、资源的动态调整以及远程管理等。针对数据库自动化运维的场景,通过数据库管理平台,能够实现自动化修数、提数、数据库安装、性能管理、容量管理等。针对运维批量操作的场景,通过作业平台,能够实现对运维操作的编排、幂等化执行以及基本管理等。
3、后台资源层
后台资源层主要包含运维架构中的软硬件基础设施,例如服务器、操作系统、存储、负载均衡、网络设备、容器等。CMDB 将收集的资源层的配置信息提供给前台接入层和中台能力层,而中台能力层则通过获取 CMDB 中的配置数据最终实现对资源的自动化运维。
从自动化运维体系架构规划中可以看出,监控体系位于中台的能力服务层,实际的监控体系是一个大的概念,监控体系主要包括日志监控、业务监控、应用性能监控、基础资源监控、中间件监控以及可视化监控。
不同的监控模块视角投射了不同的资源或者同一资源的不同维度,而且术业有专攻,因此即便是看起来很简单的监控系统,在落地实施的过程中也要按照体系化的思维来构建。这里需要额外进行的是,监控的可视化并不是一种全新的监控手段,单独提出来是因为在大多数情况下,企业中的可视化监控都相对不是很完善,我们期望的是能有一个平台将各个维度的资源信息进行数字化、可视化,从而形成一个立体化的资源监控体系。
版权声明: 本文为 InfoQ 作者【穿过生命散发芬芳】的原创文章。
原文链接:【http://xie.infoq.cn/article/b7dd8141e2f34b1f2cd9db7b2】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论