聚焦 AI 应用基础设施,云栖大会 Serverless AI 全回顾
2025 年 9 月 26 日,为期三天的云栖大会在杭州云栖小镇圆满闭幕。随着大模型技术的飞速发展,我们正从云原生时代迈向一个全新的 AI 原生应用时代。为了解决企业在 AI 应用落地中面临的高成本、高复杂度和高风险等核心挑战,阿里云基于函数计算 FC 发布一系列重磅服务。本文将对云栖大会期间 Serverless+AI 基础设施相关内容进行全面总结。
函数计算 AgentRun 全新发布

图为吴结生,阿里云智能集团弹性计算产品线负责人、存储产品线负责人,发表演讲《AI 驱动,阿里云基础设施的创新与发展》
聚焦企业级 Agent 开发场景,阿里云重磅发布 以函数计算为核心打造的 Agent 基础设施——AgentRun, 通过创新的运行时、模型服务、网关及可观测体系,为企业构筑坚实、高效、安全的 Agent 时代基石。AgentRun 采用 Serverless 架构,真正实现零运维负担,支持毫秒级冷启动的极致弹性,更能降低 60% 的平均 TCO 成本。
作为完整强大的 Agent 运行时,AgentRun 首创 Serverless 级会话亲和/隔离架构,通过毫秒级启动和上下文保持,大幅提升智能体开发、部署和运行效率,性能超越传统方案 100 倍,并率先推出支持十万函数百万实例级别的沙箱服务;全新的 AI 应用全栈可观测能力,确保每一次调用、每一个决策都可追溯、可评估。AgentRun 极大地缩短了产品从构建到上市的时间,让企业和开发者把更多精力聚焦在业务逻辑和产品打磨上。

图为周靖人,阿里云智能集团首席技术官,演讲《年度云与 AI 全栈技术发布》
基于函数计算构建的智能体运行时,是 AgentRun 的核心。它提供了一个轻量灵活、安全隔离、极致弹性且成本精益的执行环境。
安全隔离: 运行时的第一原则。 我们采用自研的“袋鼠安全容器”,它具备虚拟机的隔离强度,却拥有容器级的百毫秒启动速度。结合存储、网络的多维度多租户隔离设计,确保 Agent 可在安全的环境中执行任意代码。
极致弹性: 应对不确定负载的关键。 AgentRun 创新地将实例管理做成了数据平面,使其弹性能力无单点瓶颈,可随集群规模无限水平扩展。结合专为弹性优化的网络架构,实例可在百毫秒内启动并访问 VPC 内的任何资源,当前已具备单集群支持百万规模的智能体运行时和沙箱实例,单个智能体服务支持百万 QPS 的服务能力。
精益成本: 技术普惠的基石。 我们首创了按实例“忙/闲”状态独立计费的模式。当 Agent 等待模型或工具响应时,实例处于闲置状态,算力免费,仅收取极低的内存费用。该模式完美契合 Agent 的工作流,平均可为企业降低 60% TCO。
此外,运行时内置了开箱即用的代码解释器和浏览器沙箱等工具,无论是简单的 Agent 还是复杂的链式 Agent,AgentRun 都能获得统一、高效的执行环境。

图为蒋江伟,阿里巴巴集团合伙人、阿里云智能集团基础设施事业部负责人,演讲《AI 驱动下的阿里云基础设施:技术创新与产品演进》
AgentRun 旨在为 Agent 应用生命周期的各个阶段提供全面支持,其核心能力围绕三大层面构建:
开发层面: 框架兼容与深度集成。 AgentRun 与开发框架无关,任何框架构建的 Agent 都可以平滑运行。并且我们针对流行框架进行了深度集成。用户可能够根据自身需求,选择最适合的工具和框架,无论是基于模板快速搭建,还是深度定制,都能事半功倍。
运维层面: 全面的 AI 应用治理与可观测体系。 从统一的模型代理网关,到 AI 全栈监控与端到端链路追踪,AgentRun 帮助客户清晰洞察 Agent 的每一个行为与每一笔消耗,实现精细化的成本控制与质量优化。
部署层面: 提供安全、弹性、低成本的运行底座, 针对 Agent 应用负载特点,AgentRun 提供了深度优化的运行时,确保 Agent 在安全隔离的环境中高效、弹性地运行。
从 Serverless 到 Serverless AI**
函数计算发布 3 大运行时底座,全面加速 AI 应用创新

图为洪晓龙,阿里云智能集团产品专家,演讲《函数计算:AI 时代的最佳运行时》
作为 AI 时代的最佳运行时,函数计算 FC 业界首推从 Serverless 进化为 Serverless AI,推出三大核心运行时底座:
1. Serverless 模型运行时: 支持超 20,000 + 热门开源模型一键部署为生产级 API。通过异构算力池、请求感知调度、毫秒级闲置唤醒、1/N 卡切分技术实现实时/准实时推理场景冷启动加速,实现 RT 抖动减少 80%,最高降本 93.75%。2. Serverless 智能体运行时: 首创 Serverless 级会话亲和/隔离架构,通过毫秒级启动和上下文保持大幅提升智能体开发、部署和运行效率,性能超越传统方案 100 倍。3. Serverless 工具运行时: 率先推出十万函数、百万实例级别的大规模沙箱服务(如 Code Interpreter API),并内置 Python/Node.js/Java/PHP/Shell/.NET 等 50 余种多语言环境,支持 OCI 标准镜像,原生兼容 MCP 和 Function Call 协议标准。
这三大运行时均基于函数计算构建,为开发者提供 0 运维、极致弹性、成本最优的 AI 原生基础设施,并联动阿里云、通义实验室、魔搭社区等生态,全面加速 AI 应用创新。
FunctionAI 聚焦 4 大模块,破解 AI 开发核心难题

图为刘宇,阿里云智能集团产品专家,演讲《函数计算发布 FunctionAl:serverless Al 原生应用基础设施》
阿里云函数计算全新发布 FunctionAI,基于 Serverless 架构的企业级 AI 应用基础设施平台,旨在解决 AI 开发中技术门槛高、运维复杂及成本昂贵等挑战。
其核心模块包括:
AgentRun 智能开发平台 (核心创新):提供完整的 Agent Runtime 执行环境、基于 Session 级别的安全沙箱隔离机制、统一的 MCP/Function Call 工具生态接入标准,以及支持 20+大语言模型的智能路由与治理系统,采用按需计费模式实现成本优化,支持实例的毫秒级弹性扩缩容和百万级并发处理能力。
模型服务:支持 200+ 主流模型一键 Serverless 化部署,实现模型到 API 的无缝转换。
多模态创作平台:深度集成 ComfyUI、StableDiffusion 等工具链,提供从文生图到音视频的全模态生 AI 内容成能力。
Function Q 智能助手:专业的函数计算智能助手,集成了基于大模型的代码自动生成、智能运维诊断和系统架构设计三大核心能力,显著提升 Serverless 应用的开发效率。整体技术栈基于函数计算 FC、API 网关、RocketMQ、SLS 等阿里云成熟基础服务构建,遵循云原生设计原则,提供企业级的高可用性、安全性和可观测性保障。
FunctionAI 通过轻量化推理引擎、智能 AI 网关和全生命周期 Serverless 管理三大核心能力,显著提升资源利用率并保障多租户隔离。平台基于函数计算 FC、API 网关等成熟服务构建,为企业提供高可用、高安全、成本优化的 AI 原生基础设施。
Serverless AI 原生应用架构聚焦 AI 业务难题

图为赵世振,阿里云智能集团解决方案工程师,演讲《多模态世界的 Serverless AI 实践之路》
「Serverless AI 原生应用架构」理念,旨在解决企业 AI 业务面临的“三高”问题(高成本、高复杂度、高风险)。
从基础设施到业务接入层的全链路重构,AI 原生架构需满足算力稳定高效、系统高可用及安全管控等核心需求,尤其在 GPU 资源成本、供应保障、多可用区容灾、限流与鉴权等方面提供生产级能力。基于 Serverless 的架构新范式,利用函数计算 FC 提供灵活的 GPU 算力及一键部署模板,结合 SAE、AI 网关实现全栈 Serverless 部署、端到端观测、双层安全与简易使用体验。满帮集团的落地案例显示,该架构显著提升了 AI 应用的规模与业务表现,更是验证了架构对业务的赋能价值。让架构为业务赋能,让 AI 为世界创造更多可能。”
SAE:从传统应用到 AI 应用的一站式托管

图为张凤婷,阿里云智能集团高级产品专家,演讲《Serverless 应用引擎 SAE:从传统应用到 AI 应用的一站式托管》
阿里云 Serverless 应用引擎 SAE(以下简称 SAE) 聚焦“零改造、全托管”模式,是一个商业化 8 年、成熟兼容 K8s 的容器平台,并连续入选 Forrester(2023) 与 Gartner(2025) 全球 Serverless 领域领导者象限。AI 时代,SAE 赋能传统应用加速 AI 创新,帮助传统应用实现“简(免运维)、稳(高可用)、省(降成本)”的升级,解决运维难题,同时让 AI 应用跨越技术复杂性、稳定性与成本三大鸿沟,实现从探索到高效落地。SAE 正在成为企业 AI 时代的基础设施底座,让企业能轻松构建、稳定运行并高效迭代其 AI 应用。
携手客户,Serverless+AI 共赢
吉利汽车研究院

图为谢东,吉利汽车研究院-人工智能中心智算开发部部长,演讲《吉利汽车 AI 座舱业务落地实践:轻量化架构,智能极致体验——吉利汽车携手函数计算打造新一代 AI 业务推理引擎》
吉利汽车研究院携手阿里云团队及合作伙伴打造的吉利汽车全新一代 AI 座舱推理服务已于今年 6 月份上车,刚刚上市的吉利银河 M9 车型进行深度搭载。
阿里云基于函数计算 FC 提供面向 Serverless 化、高可用、高性能和低时延的算力集群。同时阿里云协助吉利汽车一起梳理优化座舱服务的全链路稳定性建设、模型工程化优化、模型推理高可用、模型推理加速等。基于推理业务的 C 端属性,函数计算 FC 的按量使用模式在保障用户使用体验不变的情况下,相比 IaaS 资源供给,成本优化高达 33% 。同时阿里云函数计算团队会保障算力集群的高可用和 GPU 算力的稳定供给,吉利汽车研究院的业务方专注模型服务,运维方专注业务高可用建设。
深势科技

图为丁钊翰 ,深势科技 AI 研发负责人,演讲《阿里云 FC 助力深势 AI4S Agent 业务发展》
深势科技与阿里云团队深度合作,打造了 AI for Science 的 MCP 市场,构建按需使用的新时代 Science 基建,把自身的工具,社区共建的工具,读文献、做计算、自动化做实验的工具,与先进的智能体设施进行通用的接口对接,打造 AI 智能体时代面向科学发现的智能系统。
深势科技利用函数计算 FC 提供的环境的强隔离、高可用性、状态的保留、完整的可观测的能力,快速实现了 AI for Science 的 Agent,更好的帮助科研人员做到开箱即用,节省科研人员宝贵的精力,实现了快速对实验进行规划、确认、调度、执行及生成报告等一系列流程。同时基于 AI 智能体可以批量设计数千个实验同时进行,并快速验证科学猜想,使效率得到成千上万倍的提升,以智能体时代的新基建真正为科学技术的发展按下加速键。
中国小商品城集团

图为张骞, 浙江中国小商品城集团股份有限公司架构师,演讲《中国小商品城 Serverless AI 实践之路:从 Serverless AI 土壤里的生长出来的多模态 Agent》
中国小商品城在 AI 时代的战略布局与技术实践,聚焦于构建基于 Serverless 架构的多模态 AI 智能体。
在技术架构上,采用 AI 原生设计理念,以 Serverless 为核心,通过函数计算、Serverless 应用引擎 SAE 和 GPU 资源池化技术,实现模型的弹性扩缩容与成本优化。平台集成开源 Dify 并深度优化,支持拖拽式编排与高可用部署,提升开发效率与系统稳定性。针对 AIGC 场景,利用 DeepGPU、Int4 量化等技术加速图像与视频生成,结合多级缓存实现模型秒级启动,满足智能创作业务的波峰波谷需求。平台还构建了 AI 网关、MCP 服务、全链路可观测体系(OpenTelemetry)和安全防护机制(如绿网过滤),保障高性能、高可用与合规性。典型应用覆盖智能找商找品、贸易趋势洞察、虚拟人播报、AI 玩具等多模态场景。
未来,小商品城将持续推进 Agent 全栈 Serverless 化,从 Dify 向函数计算 AI 演进,实现零代码构建与全场景覆盖,赋能商户与开发者,助力全球商贸智能化升级。
与光同尘

图为陈发灵,与光同尘 CEO,演讲《AI 赋能影视商业内容生产》
与光同尘在推动 AI 影视商业化过程中,深度依托阿里云函数计算 FC 构建面向 AIGC 的核心算力平台。作为 Serverless 化 PaaS 产品,函数计算为其商业影像生成、短剧创作等业务提供了高可用、高弹性、低延迟的 GPU/CPU 算力集群,支持毫秒至秒级按需调度资源,灵活应对平峰与高峰的巨大流量差异。其按量付费模式显著降低资源闲置,兼顾性能与成本优化,保障稳定创作体验。
函数计算内置的安全隔离、自动容灾、监控告警、日志链路追踪和异步任务调度能力,帮助与光大幅减少运维负担,实现从 PoC 快速验证到规模化生产的高效演进,完成统一资源调度与全链路稳定性建设。同时,FunctionAI 的多模态创作能力 FunArt,能够一键部署 ComfyUI 等主流应用,并提供 Serverless 化 API,显著降低环境配置复杂度与部署成本。该实践充分展现了阿里云函数计算在 AI 内容生产场景中强大的弹性能力、工程化优势与商业落地价值,为 AI+ 影视行业提供了高效、可扩展的技术底座。
创蓝云智

图为张伟,上海创蓝云智信息科技股份有限公司研发总监,演讲《创蓝云通信系统 Serverless 改造实践》
创蓝云智作为领先的企业通信服务提供商,面对业务流量波峰波谷明显、手动扩缩容效率低、发布运维复杂等技术挑战,积极推进 Serverless 化改造。
通过采用阿里云 Serverless 应用引擎 SAE、云原生 API 网关和 MSE Nacos 注册配置中心,实现了架构升级,构建了高可用、弹性伸缩的云原生体系。落地 Serverless 后,发布效率提升 60%,故障恢复时间大幅下降 70%,整体成本降低 30%,系统 SLA 达到 99.99%。 在架构实践中,创蓝云智推行同城多活部署,结合 SLS、ClickHouse 进行日志分层存储,并通过低阈值弹性策略应对瞬时流量。未来,公司计划全面推进全应用 Serverless 化,覆盖短信、万数等核心业务,并探索 AI 原生架构,开展 Serverless GPU 在模型推理场景的测试,助力业务向智能化、高效化演进。
函数计算 FC X 安诺机器人打造“爆款”展区


阿里云函数计算 FC 携手安诺机器人在云栖大会计算馆展开为期三天展出,基于阿里云函数计算提供的 AI 图像生成能力与安诺机器人的物理执行能力进行融合。用户可通过云端 AI 生成专属个性化图像,再由作为具身智能终端的机器人复刻于咖啡之上,让看得见,摸得着的 AI 互动体验尽在一杯咖啡中呈现。
展出现场获得用户热烈好评,众多媒体、KOL 纷纷转发打卡,本次展出方案为线下零售提供了一套兼具技术前瞻性与商业可行性的互动体验升级方案。它不仅有效解决了当前行业面临的成本与体验问题,也为 AI 技术在实体经济中的应用提供了一个具体的、可规模化的范例。
评论