阿里云基础设施 AI Tech Day AI 原生,智构未来——AI 原生架构与企业实践专场
活动简介

云为 AI 提供了坚实的基础设施支撑。聚焦阿里云云原生产品技术领域,阿里云基础设施 AI Tech Day 深圳站「AI 原生,智构未来——AI 原生架构与企业实践专场」沙龙于 8 月 29 日下午在深圳·LandMarkCoffee 蓝马咖啡举办,活动现场吸引了 34 家有 AI 建设诉求企业的 45 位技术负责人参与,行业覆盖移动互联网、药业、AI4Science、汽车、互金、OTA 等。本次技术沙龙聚焦企业 AI 应用规模化实战痛点分享 Serverless、AI 网关、可观测、AI 消息队列产品解决方案和企业真实实践,与企业共同探讨如何通过向更先进的架构演进来适应 AI 时代的快速变化,为迎接新的增长机会做好准备。

阿里云智能集团云原生 Serverless 高级解决方案架构师 卢萌凯(洛浩) 分享了《AI 应用正当时,详解基于 MCP 构建 AI Agent 架构新范式》,2025 年是 Agent 元年,AI Agent 正成为下一代应用的核心驱动力,Data+AI 成为帮助客户实现业务提效的核心场景,通过自然语言交互、无代码/低代码工具等方式,将数据洞察和 AI 能力相结合,加速 AI 在企业内部的普及和应用。
在这个过程中,如何开发和落地 AI Agent 应用,业界有哪些最佳实践可以参考,通过详解 AI 应用开发新范式,和广大企业客户一起探讨 AI 应用落地的趋势、挑战和方案。

阿里云智能集团云原生解决方案架构师 姚翔(弑魔) 分享了《AI 时代的智能流量中枢、AI 网关搭建与落地》,AI 网关作为企业级 AI 智能流量中枢,旨在解决 AI 应用爆发增长背景下的多模型集成、安全合规、成本控制及高可用性等核心挑战。其核心能力包括:统一接入代理,支持 OpenAI 协议及 MCP 协议适配,实现多模型(如百炼、DeepSeek)与工具服务的统一调用;安全鉴权管理,通过 API-Key 托管、消费者权限分级及内容安全检测,保障访问控制与数据合规;高可用保障机制,通过限流策略、Fallback 容灾(如 PAI 服务故障时切换至百炼)及 Redis 缓存优化,提升系统稳定性;成本优化能力,结合 AI 缓存、Token 消耗监控及多 API-Key 轮询,降低资源浪费。
在落地实践中,AI 网关针对典型场景提供解决方案:例如,通过模型名称匹配实现单一域名下多模型动态切换,降低服务分发成本;通过消费者授权机制实现用户分级管控,结合审批流自动化 API-Key 管理;利用 Redis 缓存与向量化检索减少重复请求,突破模型服务配额限制;集成夸克联网搜索优化模型幻觉问题,提升推理准确性。此外,其 MCP 代理能力支持企业构建统一工具市场,实现内外部 API 的鉴权收口与运行时管理。
典型应用场景覆盖自建模型服务(如 FC GPU 部署)的稳定性增强、多供应商模型的统一接入管控,以及 Dify 等 AI 平台的观测治理升级。通过协议转换、存量服务无改造接入及 Nacos 动态版本管理,AI 网关助力智慧停车、汽车座舱等垂直领域实现智能化升级。

阿里云智能集团消息队列产品解决方案架构师 邹星宇(吉宪) 分享了《RocketMQ for AI 的事件驱动架构实践》,RocketMQ for AI 的演进,标志着其已从传统消息中间件,全面升级为专为 AI 时代打造的消息引擎。通过在轻量化通信模型与智能化资源调度方面的“颠覆性创新”,RocketMQ 突破了传统消息中间件的能力边界,成为构建高可用、可扩展 AI 应用的关键基础设施,展现出其在 AI 工程化体系中的核心价值。
RocketMQ for AI 的增强能力已在阿里巴巴集团内部以及阿里云大模型服务平台百炼、通义灵码等产品中经过大规模生产环境的验证,充分证明了其在高并发、复杂的 AI 场景下的成熟度与可靠性。
我们坚信,通过持续的技术探索与开放共建,RocketMQ for AI 将推动“AI 原生消息队列”(AI MQ)成为行业标准,助力全球开发者更轻松、更高效地构建下一代智能应用,共同推动 AI 工程实践的标准化、普及化与生态繁荣。

阿里云智能集团云原生可观测解决方案架构师 宋明强(鸣溯)分享了《大模型时代的可观测探索》,从“互联网+”到“人工智能+”,随着云原生、多云架构、大语言模型(LLM)的爆发式发展,企业系统复杂度呈指数级增长,传统可观测技术面临海量数据实时分析、跨模态数据整合、根因定位效率等挑战。基于云监控 2.0 的统一数据模型 UModel,结合 Qwen 大模型推理能力与数据理解能力、可观测领域算法构建,大模型为可观测 AIOps 的演进提供了全新思路,将极大提升 Operation 效率和系统智能化水平。另一方面技术也在反哺 AI 领域:模型训练需要可观测性保障资源效率与稳定性,LLM 应用落地依赖实时监控以优化性能与用户体验。

37 手游运维负责人 王钊金分享了《云原生为基,AI 为翼:三七手游运维质效双升智能化探索之路》,讲述了 37 手游成功完成云原生化架构的转型与升级,并通过构建低延迟、高可用、智能化的一站式可观测平台,助力 37 手游运维质量和效率提升上取得了显著成效;同时分享了当前基于阿里云百炼+可观测 mcp 服务进行智能运维 AI 探索,通过流程编排及 LLM 以自然语言交互模式,极大提升运维高频查询分析类场景效率。

在最后的客户互动讨论环节,来自阿里云云原生团队的 PDSA、PD 和研发同学,与到场客户一起围绕企业级 AI 应用构建现状、AI Agent 生产环境下的落地场景、当前核心挑战等问题进行了深度讨论和热烈交流。
点击此处,获得【AI 原生架构与企业实践专场】活动 PPT。
评论