Agentic AI 干货!DeepSeek + OpenAI SDK 构建 Agent 实战
引言:
DeepSeek-R1、OpenAI-o1 等具备内化的假设、反思、验证等优秀推理能力的 LLM 大型推理模型将 AI 发展推进到智能体 AI 时代,将使 AI Agent 迸发出远超上一代由外化的手搓式简单推理 Agent 不可比拟的发展势能。
在 GTC2025 大会上,英伟达为我们描绘了 AI 发展的四个阶段:感知式 AI、生成式 AI、智能体 AI 以及物理世界 AI。当前,我们正处于从生成式 AI 向智能体 AI 的演进过程。智能体 AI,顾名思义,是具备自主决策、规划和执行能力的 AI 系统,它能够像人类一样,根据不同的任务和环境,灵活地调整自己的行为,以实现特定的目标。

OpenAI Agents SDK 是一个开源的多智能体工作流编排工具,支持多智能体协作和任务交接,内置多种工具,配合开发者的工具函数能够快速处理复杂任务。它结合了 Responses API,通过单次调用即可使用多种工具和模型。此外,SDK 还具备安全检查机制和执行轨迹可视化功能,帮助开发者优化性能,降低开发门槛,适合客户支持、内容生成等多种应用场景。
七牛云 AI 推理 API 提供的 R1 等大型推理模型与 OpenAI Agents SDK 的结合,为构建多智能体系统提供了坚实的自主推理能力基础。通过这种组合,可以实现各个智能体的明确分工协作,充分发挥 DeepSeek-R1 等模型在推理方面的优势,同时巧妙规避其在函数调用等方面的限制。这种“规划-执行”模式的多智能体系统,可以高效地处理各种任务,还具备强大的反思机制。

构建单个智能体最重要的是 Agent 定义(instructions)。我们需要根据任务需求,明确每个智能体的职责和功能,决定着智能体能否完成任务。接下来,配置好的智能体会对来自用户或者其他智能体的输入,根据自身配置进行分析处理(如推理模型进行推理)。
在处理复杂任务时,单智能体系统面临着一些技术挑战。一方面,大语言模型需要同时具备推理规划和函数调用能力;另一方面,提示词的复杂度也大幅增加,需要同时处理规划制定、函数调用和结果输出。此外,缺乏系统性规划也是一个常见问题,每次函数调用后重新思考,缺乏连贯的执行计划。
为解决这些问题,我们采用由多个智能体组成的多智能体系统进行分工协作,将单一大型语言模型拆分为多个专门化的智能体(如让 Deepseek-R1 进行规划,让 Deepseek-V3 根据规划来执行和调用工具)。每个智能体负责特定任务,便于系统优化和评估。遵循“智能体职责分离”原则,实现模块化设计,提高系统可维护性和可扩展性。
大模型虽然强大,但也存在产生幻觉的风险,这可能导致工作流程出错。为了提高工作流的稳定性,我们在结果呈现前增加了反思 Agent。当系统出现异常时,反思 Agent 会自动触发,对整个工作流程进行复盘和分析,找出问题所在,并提出改进方案。
AI 的发展已经进入了一个新的阶段,DeepSeek-R1、OpenAI-o1 等具备内化的假设、反思、验证等优秀推理能力的 LLM 大型推理模型将 AI 发展推进到智能体 AI 时代,将使 AI Agent 迸发出远超上一代由外化的手搓式简单推理 Agent 不可比拟的发展势能。七牛云 AI 推理 API 将 R1/V3 与 OpenAI 的 Agents SDK 的结合,让我们能够在这个新的时代中,探索开发出更多的优秀的 Agents,创造更多的 AI 价值。让我们一起创造 AI 智能体时代的惊喜!
评论