华为 JDC 登场!观测云带来下一代监控观测平台的 AI 实战解法

6 月 20 日,在华为数据中心大咖沙龙现场,观测云 CEO 蒋烁淼受邀登台,带来了重磅演讲《AI 大模型时代,数据中心从人为观测走向机器辅助观测》,与在场数百位开发者、技术负责人、行业专家深入探讨了如何基于 DeepSeek R1 大模型与 AI Agent 技术,实现可观测性数据的智能分析与自动化运维,展示了观测云在 AI 驱动可观测性平台上的落地能力。

为什么要谈“AI+可观测性”?
在复杂业务系统、庞大技术架构、高频迭代的多重挑战下,传统监控系统正逐渐失灵:
各类监控工具割裂,数据不能串联
问题定位链路长,分析效率低
运维成本高,告警误报多
团队协作难,信息不能共享

AI 成为解决这些痛点的“关键钥匙”。但想让 AI 真正服务于可观测性,并不是简单“接入大模型”那么轻松。蒋烁淼表示:“我们要的不是把大模型嵌进去,而是要让 AI 理解运维问题、适应运维逻辑、生成可执行的结论。”
从难题出发,观测云怎么做?
观测云 Obsy AI,作为全栈监控观测平台的智能核心,解决的不是“问点小问题”——而是要能辅助运维完成从现象识别到根因定位、到策略建议的整个闭环。
01 三大挑战,不容低估
数据上下文复杂:运维数据体量巨大,结构极不统一,原始数据分析可能涉及数十 GB 甚至 TB 级内容,经济性极差。
大量无效输出:大模型通用逻辑不具备 IT 运维专业知识和客户场景抽象信息,常规 RAG+prompt 模式难以在 IT 场景中获得准确输出。
推理路径过长:涉及数百个垂直场景,推理维度以万计,性能和精度难平衡。

02 AI for Observability:观测云构建“五大统一”
观测云的解决方案,不是“模型+接口”的浅层集成,而是全面构建了一整套 AI for Observability 的底座能力:
统一采集器:支持指标、日志、链路等多源数据统一采集
统一数据模型:构建时间 + 空间坐标体系,支持上下文分析
统一标签体系:实现数据语义化,让 AI 可以“看懂”业务、主机、组件等多维信息
统一数据存储:GuanceDB 3.0 提供了 Serverless 架构与流式聚合引擎,支撑 PB 级数据处理、低延迟响应与 AI 分析加速
统一数据分析:统一数据查询语言 DQL 支持海量数据快速处理和高效响应

基于以上底座能力,Obsy AI 智能体的能力实现了真正的落地,其中包括:
仪表板智能解读,给出健康度评分、重点及异常指标讲解,以及排查优化建议
异常告警智能聚合,快速发现并指向故障根因
全链路性能分析,辅助决策排查链路瓶颈
各种分析结论形成结构化、上下文明确的建议
...

03 Observability for AI:观测云让大模型调用可观、可查、可控
集成强大 AI 能力的同时,观测云同样通过自身的全栈可观测能力,为 LLM 应用提供从请求到响应的完整可视化支持:
调用链一键溯源:快速定位异常调用上下文,助力开发高效排查;
Token 消耗全景掌控:实时展示 Prompt / Completion Token 使用情况,支持模型与应用维度分析;

成本趋势预警:调用量、费用一图看清,超阈值立刻告警,守住预算安全线;
火焰图 + 根因分析:链路耗时分布一目了然,慢调用瓶颈一击即破。

与华为深度协同,打造高可用、高性能全栈可观测性解决方案
本次大会,观测云也展示了与华为在数据中心领域的协同实践。基于鲲鹏、昇腾等华为基础设施,观测云可部署于多种异构环境,实现性能保障与数据安全的双重提升,打造高可靠、强弹性的一体化可观测方案。
AI 驱动的智能可观测性,不只是平台功能的迭代,而是企业认知体系的升级。
未来,观测云将继续在 AI 与可观测性的交叉点上发力,探索智能化运维的新边界,构建更懂业务、更懂团队的智能监控观测平台。
评论