写点什么

保姆级操作指南|如何在火山方舟上构建下一代 Agent 应用?

  • 2025-12-24
    江苏
  • 本文字数:2878 字

    阅读完需:约 9 分钟

保姆级操作指南|如何在火山方舟上构建下一代 Agent 应用?

12 月 19 日,火山引擎 2025 冬季 FORCE 原动力大会开发者专场论坛举办,众多技术负责人、开发者与企业代表汇聚,共同围绕“如何构建一个更好用的 AI 应用”议题,分享技术干货。

下一代 Agent 应用该是什么样的?火山方舟通过 Responses API、Serverless RL 平台及火山 Viking 三大核心产品,为企业构建出了具备长期记忆、自主进化和复杂任务执行能力的完整 Agent,助力开发者将更智能、更懂业务、更具价值的 Agent 应用带入千行百业。

快速构建:Responses API 让 Agent 落地更简单

当前,多模态模型的统一以及多模态模型 API 的标准化,正成为行业发展的重要趋势。火山方舟 Responses API,正以两大核心能力,帮助开发者轻松构建复杂 Agent:

  • 原生上下文管理能力:支持多轮对话链式管理,可以自动维护对话历史,文本、图像、混合模态数据均可无缝衔接,无需开发者手动拼接与存储;能够缓存能力,对命中缓存的上下文 tokens 提供大幅折扣,降低延迟与成本。在典型场景中,整体成本降幅最高可达 80%。

  • 自主选择调用工具能力:用户只需发起单次请求,即可实现多个内置工具、自定义函数和多轮模型组合响应,解决复杂 Agent 任务。

目前,已有多个行业企业通过 Responses API 落地 Agent 应用。在电商领域,齐心集团基于 Responses API 构建商品智能运营平台,通过调用 API 的智能审核能力,使商品上架效率提升 80%,错漏率从 15%降至 2%;在教育行业,高途教育依托 Responses API 打造出教学与运营一体的应用体系,对外为学生提供智能答疑等流畅体验,对内快速实现客服质检等运营提效,形成完整的智能服务闭环。

开发者模式上线,提供透明 Agent 构建环境

除了高效易用的 API,更易用的工具调用链路,也被广大开发者关注。 当前,火山方舟体验中心已上线「开发者模式」

这是一个可对话、可调试、可追踪的 Agent 构建环境。对于广大开发者来说,大家可以用自然语言完成复杂任务的构建,快速验证 Agent 的多轮逻辑和行为表现。更关键的是,每一轮请求都会生成一个工具调用的节点,开发者可以看到这个节点对应的变化。该模式具备三个关键亮点:

  • 低门槛构建:无需编写复杂的流程编排代码,像书写自然语言指令(Prompt)一样即可实现工具调用与任务执行;

  • 链路透明:每一次请求、每一个工具调用及中间结果,均以清晰的节点化链条呈现,让 Agent 的决策路径真正可视化;

  • 原生记忆:依托 Responses API 的原生上下文管理能力,开发者无需手动同步状态,就能构建多轮复杂任务拆解,大幅降低调试成本。大幅降低调试成本。

方舟体验中心开发者模式已面向开发者进行邀测,欢迎前来体验。


持续进化:强化学习让 Agent 自主探索

今年以来,大模型训练加速普及,使用者越来越多。从 2024 年 10 月开源到现在,火山引擎 veRL 越来越活跃,很多用户都选择通过 veRL 用来训练自己的模型。

veRL 采用混合控制器架构,能够灵活支持不同强化学习算法,高效利用显存并集成主流训练与推理框架,支持大规模模型训练。veRL 具有以下主要特点:

  • 混合控制器架构:同时包含集中式单控制器和分布式多控制器,可灵活适配 PPO、GRPO 等不同算法的训练流程,实现高效的任务调度与编排。

  • 高效显存管理:通过 offload 机制在训练和推理间动态切换显存,支持更大模型的训练。

  • 广泛框架集成:训练侧集成 FSDP、Megatron 等框架,推理侧支持 vLLM、SGlang 等主流引擎。

  • 弹性部署能力:支持多机多卡灵活映射,可弹性扩展计算资源。

  • 模型兼容性强:支持 Qwen、DeepSeek 等主流模型系列,包括超大参数 MOE 模型。

迈向智能体强化学习阶段,veRL 进一步强化功能,从模型本身向训练智能体转换。目前,Agent 应用很丰富,但真正能够融入企业核心业务的 Agent 的还不多。大部分 AI 系统是静态的,难以随着用户数据增长,去自发地进化和提升。

当 Agent 加速融入现实世界,强化学习的重要性日益凸显。但对于大多数企业和开发者而言,独立构建和部署强化学习系统难度较大,企业需要考虑底层资源、算法框架、环境、工程构件等诸多复杂的问题。

基于 veRL 开源框架,火山方舟上线 Serverless RL 平台,通过四大核心优势,向企业提供更低门槛的强化学习体验:

  • 无需关注资源配置,通过平台即可快速启动强化学习流程

  • 支持业务逻辑灵活自定义,可无缝插入训练流程

  • 支持行为轨迹观测,能够持续优化算法效果

  • 可无缝衔接方舟推理链路,支持训练产物一键上线推理

火山方舟为用户提供高效易用的强化学习平台,是让企业和开发者把精力放在业务逻辑上,复杂的工程问题,则全部留给火山方舟。


更懂业务,Viking 让 Agent 持续创造价值

让 Agent 在业务中真正发挥价值的第三个方向,是做好上下文理解以及与企业核心业务的整合,让 Agent 真正变成企业的生产力。

火山引擎 Viking 团队在 AI 基础设施层构建了 Viking DB 与 Embedding 模型和 Rerank 模型,在上下文生产与供给层构建了知识库与记忆库,系统化解决 Agent 在感知、记忆、行动等环节所需的上下文支持问题。

首先是构造“企业知识大脑”:VikingDB 向量数据库升级了递进式的信息检索方式:首先,向量相似度会将所有“可能相关”的结果尽可能召回;接下来向量数据库会结合大模型 ranking 算法, 对召回结果做出更细的判断和排序,并将否定、比较等复杂逻辑纳入考量,最终把最符合指令的结果排到前面。

而在 VikingDB 向量数据库背后,是豆包 Embedding 模型与 Rerank 模型做能力支撑。

在第一阶段,豆包 Embedding 模型带来了更好的全模态检索能力,能更准确地对图像和视频素材进行理解和语义检索;

在第二阶段,豆包 Rerank 模型则承担起排序工作,更精准理解用户模糊的意图与复杂逻辑,比如否定、比较等,进行更有效的排序,让后续的 LLM / VLM 更加轻松地去做理解与生成。

二者相辅相成,共同支撑起 VikingDB 的领先能力。

其次是让智能体拥有“长期工作记忆”:记忆能力与个性化体验,是每个 AI 应用创造长期价值的重要因素。火山方舟通过 Viking 记忆库,为广大企业提供记忆能力。在记忆能力上,Viking 记忆库不仅能记住纯文本内容,还能记住图文模态的内容;在性能上,Viking 记忆库通过抽取策略,能在保留关键记忆片段的基础上进行高度压缩,并在对话中针对性地进行召回,不仅节省 tokens 消耗,还能实现更精准的个性化交互。


最终,当 Viking 将当知识库与记忆库深度融合时,能发挥 1+1>2 的效果,为大模型开发提供更高质量的上下文内容。用户在对话过程中上传的图片、视频、文档等信息,一方面可以被精准解析成知识,让大模型来参考回答;另一方面也可以提炼出有价值的用户记忆与任务记忆,实现更加个性化的交互体验。


实践方面,火山引擎正在积极与各行业企业展开深入合作。比如在具身智能这一前沿领域,英伟达将 Omniverse 与 Isaac Sim 仿真平台集成至火山引擎云上,Isaac Sim 5.0 通过开源核心、引入神经重建与物理引擎升级,显著提升仿真真实性与数据生成能力,全面支持端到端的机器人训练有效加速智能体在物理世界中的学习与落地进程。

为进一步降低使用门槛,火山方舟全面升级“协作奖励计划”,向认证企业用户提供每日 500 万免费 tokens,向个人用户提供每日 200 万免费 tokens,且每个模型均可单独领取,帮助企业与开发者构建更智能、更懂业务、更具价值的下一代 Agent 应用。

点击【阅读原文】,即刻体验 https://www.volcengine.com/docs/82379/1391869?lang=zh

用户头像

还未添加个人签名 2022-01-25 加入

还未添加个人简介

评论

发布
暂无评论
保姆级操作指南|如何在火山方舟上构建下一代 Agent 应用?_火山引擎开发者社区_InfoQ写作社区