IT 运维管理指什么?如何建立有效的 IT 运维管理系统?
我们大家都知道很多公司都有一个部门叫做 IT 管理部或者 IT 运维部。那具体 IT 运维管理指什么?如何建立有效的 IT 运维管理系统?今天我们就来一起简单了解了解吧!
IT 运维管理指什么?
【回答】:所谓 IT 运维管理是指单位 IT 部门采用相关的方法、手段、技术、制度、流程和文档等对 IT 软硬运行环境、IT 业务系统和 IT 运维人员进行的综合管理。
如何建立有效的 IT 运维管理系统?
【回答】:如果公司的运维诉求并不复杂,各种性能监控、告警预警做好,再辅助一些自动化运维工具,至少能满足 8 成以上的需求。建立运维监控体系,粗略的可以从以下四个维度来看:
1、第一维度:基础运维监控
最底层、最常见的运维监控工作,主要对各类硬件、操作系统进行性能及状态的监控,这是所有上层服务系统、业务系统等应用层的基础,此类服务方案市面上很多,也可能大公司自研就解决了问题。行云管家提供了从主机、网络、数据库、磁盘、对象存储、CDN 等常见的监控事项,在主机方面支持公有云、私有云、局域网、资源池主机,在主机菜单界面用户可选择网络视图、标签视图、分组视图展现方式,内部主机可自定义标签,如:生产环境、测试环境、业务应用等。
2、第二维度:自动化运维处置
在重复运维工作之中,通过提取标准化的工作流程并辅以相应的工具,就可以把重复的工作通过像任务编排加以定时器,让任务自己去跑,能减轻不少运维工作的负担,此类自动化运维工具市面上开源的一堆,问题就是各自为政比较零散。行云管家支持业界知名的 SaltStack/ansible 运维工具库 ,并支持用户新建各类自定义 Shell/Python/PowerShell/CMD 脚本,能够批量对主机执行脚本、命令,以及将文件批量分发至目标主机、批量从多台主机采集文件,实现对多台主机的各种批量运维操作。同时,用户可以根据业务要求编排运维任务,设置各种触发条件,一旦触发后,系统能够自动执行相应的已编排好的任务,例如:云主机自动升级、应用自动部署等,极大的降低应用部署与管理成本,提高业务敏捷性,满足企业用户对自动化运维的需求。
3、第三维度:云/计算资源生命周期管理
此部分的工作运维不一定负责,主要看公司的职责划分,现在不是几服务器组在一起就叫 XXX 数据中心/XXX 计算实验室,在传统自建机房、IDC 托管之外还有公有云、私有云等,物理设备变复杂的同时,网络结构也变得复杂,如何统一各方计算资源并进行利用,是个难题。这里的云/计算资源的生命周期管理,其实就是指的云/计算资源的申请、创建、交付、运维以及最终的销毁释放等,行云管家主要通过资源池、主机模板、流程工单驱动这一过程。在行云管家中,允许用户将自己的公有云账号/私有云平台按照一定的业务逻辑(如地域/数据中心、VPC/网络等多种维度)划分成若干个资源池,将这些资源池分配给不同的业务单元使用,每个业务单元的成员只能在各自的资源池中申请、创建、销毁云资源,实现精细化的云资源分配。
4、第四维度:运维安全合规审计
其实就是装一个俗称堡垒机的运维审计系统,防止运维人员有意或无意的高危操作,防止删库跑路事件的再次发生,主要核心功能“事前授权、事中监察、事后审计”就算一旦发生运维安全事故,就可以通过这东西溯源追责。行云管家内置了堡垒机模块,所以无需再集成第三方的堡垒机系统,行云管家采用基于角色、部门、成员的访问控制模型来实现权限控制,具体来说,是将授权模型划分为功能授权和资源授权两个维度,在两个维度基础上进行对象授权(角色、部门、成员),将这两种权限授权给团队中的某成员或他所在的角色、部门时,该成员便自动拥有了所被授予的各项权限。另外一个,我们在运维时可能会用到“个人喜好的工具”但是这些工具,系统不会预装,如果要使用又怕系统安全、数据泄露等问题,为了解决这个问题,行云管家提供应用宿主机的方式支持应用的安装、配置及发布。
以上维度基本就能满足公司需求了。公司可以根据具体需求建立有效的 IT 运维管理系统。如需了解更多,请拨打 4008825683!
评论