写点什么

032 云原生之 AIOps 运维

发布于: 刚刚
032云原生之AIOps运维

AIOps 运维流程从数据采集到最终实现智能决策大致要经历四个阶段,包括传统运维平台的数据采集、数据聚合、数据分析和智能决策阶段


数据采集是 AIOps 的基石。运维数据来源于开发运维流程管理各环节的工具链以及对它们的整合,深度集成开发运维工具链是设计良好 AIOps 解决方案的开端。


数据聚合为智能分析提供了有利条件。运维的数据是多样化的,包括了各种不同来源、不同格式的数据,如历史日志、网络互联数据、文本、在线互联数据、业务系统运营指标、社交数据等。


数据分析是智能决策的前提。数据一旦被采集并且经过初步处理,就能用于统计分析,统计人员将从不同形式数据中发现出某些规律,描画出数据背后的见解。


智能决策是 AIOps 的最终目标。运用机器学习的方法使系统自动地应对从数据中提取出来的信息,将数据洞察力转换为行动力,做出最终的决策,智能化地解决运维运营中的复杂问题。


AIOps 主要解决了两大类问题:第一,时效类问题。运维的本质是提供稳定可靠的服务,而达成这个目标的关键是足够好的时效。时效类的场景还有很多,例如更短的 MTTR(平均故障恢复时间),特别是在服务规模很大的情况下监控数据采集、存储、分析,问题的跟踪、定位、恢复的执行规划等。


第二,协作类问题。人类的生产离不开协作。尽管有了自动化运维平台或工具链,运维的很多场景依然需要许多人工协作。一个经典的例子,产品使用者或测试人员发现了问题,提交工单给 IT 服务台,IT 服务台根据经验初步判断可能与哪些系统相关,再通知相关团队,相关团队判断是否是自己的问题,如果是自己的问题则考虑修复方案,然后修复,再反馈给 IT 服务台,通知问题发现者。在 AIOps 的帮助下,这个流程会被完全革新,不需要各个角色的参与,AIOps 会实时检测线上异常,再对异常进行根因分析,接着提出修复建议或者直接自动修复。


发布于: 刚刚阅读数: 3
用户头像

InfoQ签约作者 2018.11.30 加入

热爱生活,收藏美好,专注技术,持续成长

评论

发布
暂无评论
032云原生之AIOps运维