制造行业数字化运维破局之道
项目背景
某大型汽车制造集团,致力于通过数字化、智能化运营手段为用户提升提供高品质的汽车产品和服务。IT 部门不仅为内外部持续提供服务,同时为业务运营与核心系统运行提供重要支撑。数字化运维作为数字化转型的核心基础,不但要保障数据安全、故障排查、流程管理等日常运维管理,而且要快速满足不断增长的业务需要。
IT 面临的挑战
缺乏统一监控的标准和体系
对不同监控系统之前数据接入和维护的统一标准、监控的关键指标以及精准告警的需要更高的要求。
缺乏 IT 数据的管理
多个监控系统之间数据无法打通和联动的问题,多种模型采用相同的模版,历史缺失数据无法有效补充,难以配置关联关系。
缺少标准的服务与流程
内外部 IT 服务缺少统一、标准、规范的流程,业务、组织、资产需要相匹配的业务闭环进行统一的管理,快速响应,提高服务水平。
建体系铸平台
通过深度调研和运维咨询服务落地,帮助客户构建运维数字化蓝图、运维数字化技术框架、运维数字化建设路线的规划,实现运维服务“面向业务与数据”的转型。同时根据数字化运维顶层设计,逐步落地实践,最终达成“降低成本、增加效益、安全运行、保障业务”的目标,大幅提升整体运维服务水平。
全链路监控体系
统一关联业务系统的应用/基础/网络视图,统一关联设备本身的运行,设备之间、设备与系统间的关系视图情况,提升运维及故障处置效率,强化业务连续性。
监控指标: 接入第三方监控的指标,并进行清洗入库,提供指标数据支撑。
日志监控: 接入日志数据,全量日志数据统一采集分析。
调用链: 对 APM 指标/调用追踪数据进行梳理,接入及验证,提供应用调用相关数据。
告警数据: 接入第三方监控工具的告警,基于指标和算法进行智能告警场景应用。
智能化数据能力
落地 CMDB,实现配置数据归一化更新和一元化引用,监控指标、日志、告警数据集中存管,协同 ITIL 流程、协同部分自动化运维场景,制定配置数据消费服务标准,配置准确率达到 95%。
以各应用系统为维度,从应用——>服务——>组件——>虚拟主机——>物理机——>交换机——>终端设备进行垂直梳理,并进行关联关系梳理。
全链路监控模块通过接口方式调用 CMDB 的配置数据及配置项关联关系进行相关拓扑展示。
当出现故障的时候,可快速查看到告警对象相关的配置数据及关系数据,快速定位问题。
IT 共享服务能力
从被动式变为主动式 IT 服务,全面数字化服务响应和服务处置,业务流程实现标准化和智能化,IT 组织变得高效敏捷实现 IT 预期价值,降本增效,服务质量和用户体验大幅提升。
基于 ITIL/ITSS 的 IT 服务管理,建设组织/流程/人员规范化体系。
服务台(ITSM+事件)、智能机器人(ITSM+自动化)和知识库(ITSM+监控)服务能力。
自动化巡检、智能化定位分析、自动化运维等 AI 运维场景应用。
客户价值
利用标准化的业务-IT 全链路监控机制,通过标准化和监控指标体系,实现“快速发现、根因定位、防止再发”,保障业务连续性的同时,服务响应处置、IT 管理决策、组织流程优化全面提升。
建立监控标准: 统一监控指标和标准,扩大监控范围,问题发现时间减少 20 分钟。
全链路监控: 统一关联业务系统从终端到应用的全链路视图,重大问题定位与解决时间减少 1 小时。
CMDB 体系建设: 系统、资产和数据标准化、规划化应用,减少业务风险,提升处置效率,数据纳管率提升至 95%
版权声明: 本文为 InfoQ 作者【云智慧AIOps社区】的原创文章。
原文链接:【http://xie.infoq.cn/article/63364b572b9be06bce0bc4225】。文章转载请联系作者。
评论