写点什么

大型集团企业云管平台建设参考架构

  • 2021 年 12 月 30 日
  • 本文字数:3832 字

    阅读完需:约 13 分钟

摘要:本文通过对不同的集团企业及国家机构 IT 治理组织架构提出华为云管平台集中部署、分布式部署、分散独立部署三种方式,实现集团企业 IT 云时代的治理管控诉求。

 

本文分享自华为云社区《【华为云Stack】【大架光临】第6期:大型集团企业云管平台建设参考架构》,作者: 华为云 Stack 云管平台首席架构师 熊洪槐。

一、集团企业云化 IT 建设及管理问题及诉求


集团企业由于具有多层次组织结构、多元化业务、多地域产业布局等诸多特点,在管理方面面临很大挑战,IT 平台已成为集团企业运营管理运作必不可或缺的重要组成部分,是当前集团企业数字化管理升级及数字化生产及创新的核心支撑系统,所以,集团企业 IT 建设及治理一直是集团企业的投资重点,特别是近 5 年,在业务数字化转型及云化 IT 技术驱动之下的建设投资不断增加,据 Gartner 预测:2021 年中国 IT 支出预计将增长 7.2%,2021 年全球 IT 支出预计将增长 4%,另外,据 iThome 2020 年数字化转型领先企业调查报告,数字化领先企业 2020 年 IT 投资比例最高达到营收的 5.1%(平均 4.1%)。然而,另一方面,2019 年埃森哲对中国企业 IT 调查报告显示,具有三分之二的企业对 IT 投资回报不满意,如何建设好 IT、运营好 IT、使能企业数字化转型战略实现,是当前政企在数字化、云化 IT 转型时代面临很大的挑战,对于集团企业尤甚。


对于集团企业,当前云化 IT 建设过程中存在技术和管理两大问题:


1、“零、散、乱”问题突出,存在重复建设及资源浪费等现状:过去几年,集团企业内部为了满足业务数字化转型诉求,“ 千帆竞渡, 百舸争流“ ,集团、各分支组织纷纷建设各种私有资源池或云平台,满足了当时集团企业起初的 IT 敏捷和创新诉求,然而它并没有完全彻底改变集团企业 IT 的孤岛现象,依然存在一系列的业务、数据断点,IT 运维及运营管理复杂度反而因为新技术的引入增加了,各分支组织云资源不能共享,资源利用率低,存在较大的浪费。


2、缺少云运营管理体系建设,集团企业云管平台建设能力不足:依然还是采用过去重 IT 建设及管控、轻运营 IT 治理管控思路,缺少针对云化 IT 时代面向集团企业整体的 IT 服务流程设计及云管平台建设的重视,对“实时体验、敏捷创新、共建共享”的 IT 云化、服务化目标践行不足,以至于依旧对 IT 建设价值回报说不清楚,资源占用空转浪费,用户抱怨的周期长,过程繁琐等问题依然存在。 


以上两大问题,其实质是要求解决集团企业在近几年业务驱动之下的 IT 云化大建设中 IT 治理管控及职责转型问题,需要集团企业 IT 建设和管理部门回答:

  • 如何打通集团现有或未来分支组织的各个云平台,让 IT 资源及服务能力在集团企业内部协同共享、甚至能力溢出;

  • 如何支持集团总部及各分支组织之间的责、权、利流程承载,实现集团企业 IT 有效治理管控,实现放而不乱,活而有序,满足数字化转型时代集团企业对 IT 敏捷创新,安全稳定兼收良好局面;

  • 如何支持 IT 职能部门从建、管、维的重复及低效的工作中释放出来,通过云化 IT 能力平台建设,成为业务数字化转型的技术赋能者和业务创新的推动者

  • 如何从过去只建不营、依靠经验的粗放式 IT 经营管理模式,转变数据驱动 &价值驱动 IT 精益管理模式

二、华为云管平台 ManageOne 介绍


如何满足云化时代集团企业 IT 治理管控诉求,一个匹配集团企业管控架构的 IT 治理组织及流程、一个好的 IT 总体架构规划是集团企业是前提,当然顺应 IT 云化转型时代的 IT 管理及承载 IT 治理流程的云管平台是核心,云管平台承载集团企业多云整合、资源自动发放、资源调度及优化,全栈运维管理、服务自助、计量计费、服务支持及等 IT 管理业务及 IT 服务流程。


华为公司云管平台 ManageOne 产品借鉴和吸收华为公司自身数字化转型多年的云化 IT 管理实践,以数字化驱动引擎、智能化流程引擎及云联邦技术为核心,针对政企 IT 打造了运维中心、服务中心、运营指挥中心三位一体的云管平台,围绕应用、云服务,云资源全生命周期构筑了面向云化 IT 时代政企 IT 全栈、全场景数字化 IT 作业及管理平台,并以灵活的部署架构可以满足不同集团企业 IT 组织架构诉求。



​ManageOne 云管平台包括 OC、SC、OCC 三个子系统:


运维中心 OC:提供开放式、数据驱动的运维框架,集成和整合各个云厂商的运维管理系统,支持 8 大厂商 14 类云或虚拟化平台集中运维管理能力,支持统一资源、统一拓扑、统一监控、统一巡检、统一(自动)作业、统一运维报表等运维管理能力,并实现了运维能力向租户(业务 IT 部门)服务化,实现了业务运维及系统/平台运维数据打通及流程协同,解决了以前系统运维及业务运维数据孤岛及流程断点,通过数字化流程实现了云化全栈数据中心集中运维、智能化协作管理能力,极大提升日常运维管理效率及故障诊断效率。


自助服务中心 SC:结合以应用为中心,以企业 IT 项目运作管控为手段政企 IT 管理思路,实现了对 IT 应用、IT 基础资源、IT 服务生命周期管理及流程支持,通过资源发放及时率 KPI 为驱动,打造云资源在线交付业务流程,流程高效、责任清晰,通过 IT 能力服务化、在线化,打造有效的云服务管控流程,实现 IT 管理部门与业务部门 IT 服务共建、共享、共治。


运营指挥中心 OCC:基于政企 IT 运营及治理视角,提供人、项目、部门、应用等不同维度的云化数据中心 IT 资源及 IT 服务全方位精细化可视分析,为云数据中心高效运营及改进提供科学决策提供支撑;基于一套智能化流程引擎打通 IT 运维部门、业务 IT 部门、IT 运营部门之间的协同关系,为政企云化 IT 转型组织提供云化时代的值班监控、事件管理、问题管理、变更管理等领先的 IT 服务管理流程,并融实时监控大屏、自动决策引擎一起为政企云化 IT 提供一套联动指挥、察打一体数字化指挥作战平台,使能 IT 运营从传统管控作战模式转变为以服务为中心的数字化、价值驱动作战模式。


对于集团企业,根据集团企业中央集权、联邦及分散自治三种不同 IT 治理组织,ManageOne 三个子系统提供了灵活的部署能力,满足不同集团企业 IT 治理管控诉求。

(1)分散独立部署模式,分支云各自运维及运营


分散独立部署模式,集团企业各个分支组织各自建云和独立云管平台,各分支组织独立负责 IT 项目规划、投资、建设,IT 运营及管理由各分支组织自行决定。



​此部署模式适应于分散、弱管控 IT 治理组织集团企业,此部署模式需求响应更为及时,其主要问题是 IT 资产不能共享,长期来看会导致成本上升,也不能满足集团企业数字化转型对云化 IT 平台要求。


为了改善集团对各分支组织的 IT 监督及统筹能力,集团总部建设统一 IT 运营指挥中心 ManageOne OCC,实现集团 IT 数字化在线可视化运营能力,实现对集团各分支组织 IT 的监督、集团 IT 统筹规划及质量运营能力。

(2)集中部署模式,实现集团企业统一运营,统一运维


集中部署模式,就是集团企业建设统一的集团云管平台 ManageOne,实现整个集团统一运营,统一运维,如下图:



​此部署模式适应于中央集权制 IT 治理组织架构集团企业,集团公司 IT(信息)组织作为和独立分支组织/子公司平行组织存在,其特点是集团对各个分支组织(业务组织)的信息部门具有强有力的管理,集团 IT 平台采用统筹规划、集中建设,各分支组织只有使用权,并下设子组织实现对各个分支组织或业务部门进行业务支撑。


集中部署模式的优势能够很好地整合及集成集团企业内所有云平台资源及非云化 IT 资源,实现集团企业 IT 资源统一共享统一的 IT 服务台统一 IT 数字化运营及运维,实现集团内 IT 资源、平台及人力最大共享,保持集团 IT 技术架构及标准的一致性,并可以很好提升统一集团 IT 品牌,提升 IT 用户体验,甚至为集团 IT 能力对外溢出打下基础。

(3)分布式部署模式,实现集团企业统一运营,分级运维


分布式部署模式,就是集团企业统一统筹规划云平台及云管平台建设,通过云管平台分布式以,实现整个集团统一运营,分级运维,如下图:



​此部署模式适应于联邦制 IT 治理组织架构集团企业,由 IT 部门与分支组织联合进行 IT 管理,各自负有明确的职责。IT 治理决策由多部门在衡量各种影响因素之后,此类集团企业的 IT 准则是强调流程、技术和数据模型等方面的共享和重用,通过 IT 治理机制及流程协调全局和局部控制之间的关系。


分布式部署模式的优势兼容分散部署及集中部署两种优势,能够实现集团企业 IT 资源有限共享,并建设集团企业统一的 IT 服务台及值班管理,实现统一 IT 数字化运营指挥能力,让集团总部履行 IT 监督及协调角色,并支撑集团 IT 的统筹规划,分支组织也具有一定的自主控制权利,快速响应分支组织业务 IT 诉求。


ManageOne 云管平台对集团企业的各个分支云支持完全纳管和联邦接入两种管理方式,完全纳管接入方式只部署 ManageOne OC 运维中心,保留本地运维能力,自助服务统一接入集团总部 ManageOne SC;联邦接入方式则同时保留 ManageOne SC 和 OC,分支组织具备对分支组织内的云服务及资源的发放自主经营权利,跨分支 IT 资源则到集团云管平台申请。

三、华为云管平台 ManageOne 的成功实践


2020 年初,华为与某国有大行共同建设部署了华为云 Stack 解决方案,支撑该行总行云、测试云、研发云、分行云、SaaS 金融生态云落地。华为 ManageOne 作为云管理平台,对该行金融云进行服务供应、运营运维,当前该行已实现 100%核心业务上云,并经历了多次高峰业务锤炼。


ManageOne 提供的 AutoOps 自动化运维平台,将日常运维如打补丁、巡检、修改密码等动作标准化为场景脚本,部署到海量需维护的设备中,通过立即/定时的批量执行脚本/命令,一键完成维护。当前该行已实现了万级主机批量运维,颠覆了传统运维模式,同时专家的运维经验得到了沉淀和传递。此外,ManageOne 提供服务构建器来进行复杂云服务的构建。在双 11、纪念币秒杀等大型业务高峰场景前,业务部署效率从小时级缩短为秒级。


点击关注,第一时间了解华为云新鲜技术~

发布于: 刚刚
用户头像

提供全面深入的云计算技术干货 2020.07.14 加入

华为云开发者社区,提供全面深入的云计算前景分析、丰富的技术干货、程序样例,分享华为云前沿资讯动态,方便开发者快速成长与发展,欢迎提问、互动,多方位了解云计算! 传送门:https://bbs.huaweicloud.com/

评论

发布
暂无评论
大型集团企业云管平台建设参考架构