细数云上综合治理始末,华为云联创营解码企业运维之道
随着国家大力推进数字经济发展,云计算成为推动数字化转型的重要引擎,企业上云成为主流趋势,越来越多企业通过数字化寻找二次增长新曲线。随着云技术的不断发展,企业的关注点也从能否上云转移到云上技术的完整性。此时,云厂商不再只是卖云,而是必须要给客户出一张云技术网,全方位解决企业上云的后顾之忧。
如果说,企业上云逐步成为企业战略部署的一部分,上云于企业来说不再是终点,云上业务将触及到企业的各个层面。那么如何切实地用好云、管好云,为业务持续赋能,则是技术专家们需要关注的重要命题。
4 月 22 日,华为云联创营云上综合治理研讨班在南京拉开帷幕,用云专家齐聚一堂,共同探讨云上治理新观念,围绕企业 IT 架构演进、安全、高可用、容灾备份等优秀实践进行分享与探讨,更好地帮助企业用好云、管好云,提升云效能。
从企业上云到云上企业,企业用云逐渐发生根本性变化
以前我们说“企业上云”,是指 IT 基础设施与应用上云。企业把各类管理系统、生产系统、营销系统从原来老旧机房或独立 IDC 搬到云上,节省大量 IT 基础设施建设成本和运维成本。也有一些企业把核心业务搬到云上,利用云的动态弹性扩展能力,解决业务急速增长时的 IT 瓶颈问题。
而在数字经济高度发展的今天,企业需要通过上云实现生产在线和管理在线,通过连接外部更广泛的社会资源、实现业务流、货物流、资金流、人才流、信息流——上云不只是一种技术升级,更是一种新战略的开启。企业以云为基础,能够让更多相关业务在云上接形成共生网络,运行产生的大量的为交互数据,企业将通过算法挖掘,实现智能化,进而为数字化业务创新提供无限可能。
从 On Cloud 到 In Cloud,从“云移民”到云原生用户,这一身份转变意味着企业更多关注应用层面和公司整体战略层面的转型。企业业务云化的过程不仅是一个技术升级,更是一场企业战略的变革:不仅要实现企业 IT 架构升级的支撑性要求,还要实现业务重塑、降本增效、找到新的业务增长模式的发展性要求,同时还要满足安全合规、风险管控、绿色发展等多方面的约束性要求。
所以,企业从“上云”到“云上”,不再只是文字顺序的变化,而是涉及到企业应用整体治理体系的变化、企业组织架构的适配、企业云化文化和思维方式的塑造、项目实施管理、持续的运营运维优化等。因此, 在场数字化转型的浪潮中,作为保障企业业务系统正常运行的“基石”——IT 运维,尤其显得重要。
业务云化后如何用好云
六大治理体系绘就“云上运维图志”
企业使用云计算等技术高效地实现数字化转型已成为大势所趋,企业上云技术架构规划贯穿企业上云、用云的全过程,是企业云上成功的基础性保障。华为云从六个层面提出建设性规划,同时对企业云上支出、性能下降、安全问题、业务平稳等问题提出的细化解决方案,六大最佳实践覆盖架构管理、IT 治理、安全管理、业务高可用、容灾备份以及运维管理领域,对应的是企业云上综合治理的实操难题。
在架构管理方面,华为云全业务上云解决方案专家指出,当前企业业务云化的过程不再是技术层面问题,而是一场思维观念的变革,涉及到企业的 IT 治理、组织架构适配、企业文化、思维塑造、方案规划、设计实施、持续运营等方面。企业必须要有一套全面的方法论及技术体系来支撑,才能确保上云、用云之路更顺畅。
在传统的 IT 治理中,IT 运维治理是业务稳定运行中重要的一环,在云端亦是如此。在企业全面云化过程中,企业需要将 IT 治理模式延伸到公有云上,业务对云的依赖程度有多高,云上运维就有多重要。然而,面对云上运营手段单一、运维方式分散以及缺少统一管控等 IT 治理运挑战,如何更好地为业务稳定运行护航?对此,华为云特别强调最小授权原则,授权范围尽量缩小,授权操作尽量缩小,将用户权限做分门别类的管理,从而预防管理大规模基础设施的失控风险。同时针对云成本浪费问题,华为云细化计费方式,提供按需或包月等方式,并及时识别资源使用率较低的任务,合并降低费用,还能针对不同的业务类型提供更具性价比的计算实例,降低云上使用成本,这些方法都能为企业带来实际成本的节约。
当业务在云端稳定运行之后,随着业务之间的交互,大量的交互数据在云端产生,数据存放云端,数据的泄密与云上安全管理,成为企业着重担心的问题。华为云结合自身管理实践经验以及自身管理业务,打造一整套安全治理框架体系,“云服务网络安全与合规标准”(Cloud Service Cybersecurity & Compliance Standard),简称“3CS”。据悉, “3CS”是基于云服务各业务模块的流程,划分相对应的安全控制领域,使安全控制要求得以嵌入到云服务管理流程中,同步确保安全管理责任清晰明确、可度量、可追溯,从而实现全面有效的安全治理,确保数据安全。
如何保证业务连续性已成为当前企业稳定发展的关键条件,是企业的赖以生存的“生命线”。结合云自身的能力,企业需要审查并改进云业务架构,保证高可用。然而,企业云上可用性目标的达成是一项系统化工程,必须要结合架构设计、业务流程设计、运维流程设计等手段。针对云上业务系统进行端到端压测及性能容量分析,设计整个业务系统的故障模拟、故障演练等方式,以此来对业务系统可用性的目标进行验证。
在此次研讨会上,华为云客户可靠性工程架构师,从规避故障、设计告警、快速恢复三方面,针对高可用分享实践与提出建议:首先,华为云通过架构分析与优化、可用性检查、安全评估能力聚焦高可用架构和应用部署设计,审视架构是否是最佳,发现高可用风险,并协助客户进行优化;其次,华为云通过资源监控与优化为客户设计立体化的监控体系,全方位监控业务系统的运行状态;通过业务压测、容量优化协助客户测试系统各项性能指标,发现系统瓶颈进行系统调优、保障客户在平衡成本的同时带来业务性能最大化;最后,华为云制定了业务系统关键节点应急调整的方案,通过构建逃生通道、高可用部署优化、切换演练能力,协助客户梳理关键节点应急逃生方案,灾备切换能力建设。
随着企业核心业务全面云化,企业对业务实时性要求提升,面对突发性灾难、人为破坏等对企业数据和业务生产带来不可预知的影响,云上容灾备份必不可少。企业需要结合云上能力建立有效的业务连续性管理体系,完成云上信息化架构的容灾架构设计,并构建同城/异地的容灾中心,保障业务持续运行。华为云构建多云、跨云的容灾系统,在云上容灾方面,支持同城容灾、异地容灾,可提供跨可用区 RPO=0、分钟级 RTO 的虚拟机级容灾保护,满足 6 级灾难恢复标准。
面对企业上云之后带来业务规模与复杂度的日趋增长,华为云构建了一套完整的面向云上应用的立体化运维系统,通过融合 AOM、APM,提供云应用基础设施层、应用层、业务层的运维能力,并对各类资源可实现多维度实时监控、并通过应用与资源关联分析技术,实现问题快速诊断和修复,保障云上应用持续稳定运行。
小结
华为云联创营是华为云联合华为无线 X Laba 实验室联合打造的,以云、AI 等为技术底座,与互联网技术创新型企业一起,进行创新场景和创新应用联合开发。 未来,华为云希望通过打造系列性活动,让企业管理者可以畅所欲言,通过平台进行深度交流,解决企业用云、管云中的“疑难杂症”,持续打造云上综合治理创新样板,不断提升云上综合治理质量和水平,共同构建健康可持续发展的云技术生态。
评论