写点什么

“一人即团队”——一句话驱动智能体团队

  • 2025-09-15
    北京
  • 本文字数:3843 字

    阅读完需:约 13 分钟

“一人即团队”——一句话驱动智能体团队

9 月 9 日 WAVE SUMMIT 大会现场,文心快码全新升级到了 3.5S 版本,强化多智能体自协同能力,实现“一人即团队”开发新模式。


01 浅析多智能体协同

首先,智能体能力更强,能懂业务,会分解任务列表,执行更准;其次,从单智能体到多智能体协同,动态生成多个智能体,自主协同一起解决复杂任务;最后,团队协作更强,基于 Rules 与 MCP 构建统一的经验库和外部工具,实现团队知识传承和外部开放性建设。

很多朋友之前接触 AI 工具时,可能更多是一个智能体帮你写代码、调试一个问题,属于“单兵作战”。

而现在,新的趋势是:让多个智能体协作,就像一个小团队一样,把更复杂的任务完成。

就像我们平时做一个项目,需要产品经理、开发、测试、运营一起配合。AI 世界里也可以这样⬇️⬇️

1.不同的智能体各司其职,有的负责规划,有的写代码,有的调试,有的做体验优化。——生成效果更好

2.子 Agent 使用独立的上下文窗口,且独立执行,不会干扰主会话上下文。——突破上下文限制

文心快码的 Subagents 是一种多智能体自协同引擎。通过主 Agent 对任务进行拆解,多个子 Agent 协作处理规模更小、目标更聚焦的子任务,从而让复杂问题的解决更高效、更有条理。


02 多智能体协同的应用场景

在代码助手场景下,多智能体协同能够让不同智能体各司其职、相互配合,比如一个智能体专注于代码生成,一个负责代码审查与风格优化,一个负责测试与调试,还有的进行安全检测与性能优化。它们通过分工合作和互相校验,不仅能提升代码质量与开发效率,还能减少遗漏和错误,形成从需求拆解、代码实现到测试优化的完整闭环,从而更好地帮助开发者解决实际问题。另外子智能体核心解决的问题是上下文窗口不够,子智能体的层级隔离策略让他的上下文可以完全独立于主 Agent,使主 Agent 的上下文一方面减少冗余信息,另一方面减少污染,避免幻觉。

我们实现的架构是这样的:系统级智能体专门用于调度其他智能体,统筹智能体之间的信息传递。开发者按需定义属于个人工作习惯的个人级智能体,通过自然语言 Workflow。其他能调用到的工具还包括,项目级 MCP,开发者根据所开发的项目进行 MCP 的定义,如后端项目需要链接 Mysql、前端需要链接 Figma,并注册到子智能体中。Rules,项目级,开发者根据所开发的项目整理 Rules。那么这整套的架构,就保证了我们复杂任务的高效完成。

对于开发者来说,文心快码 Subagents 应用在如下场景有显著效果:

垂类场景效果有优化:如代码评审、生成文档等可自定义符合团队规范的 Agent,通过委派最合适的子 Agent 执行,从而获得更佳效果。

适合复杂工作流编排:从需求拆解到开发、测试、文档生成,形成完整流水线。

大规模任务执行:代码库规模庞大、跨多个文件或模块协同修改需求。

文心快码 Subagents 能力除了使用内置的多个官方 Agent 进行协同,也支持使用自定义智能体

自定义智能体功能允许你根据自身需求,创建并配置专属的智能体。它可以具备特定角色、技能和行为逻辑,帮助你在不同工作场景下高效完成任务。

自定义智能体最显著的优势在于:

  • 可定制性:用户自由组合行为规则与可调用工具,实现灵活配置

  • 垂类效果提升:针对特定业务需求优化表现,效果远优于通用模式

自定义智能体适用于如下场景:

  • 只需要执行特定工具的专属行为模式

  • 需要高度控制与编排能力的复杂工作场景;

  • 企业或个人的领域知识服务场景。


03 看几个有趣的小例子!

Case1:0-1 生成包含 20 个游戏的游戏平台

之前我们常见的 Agent 能力,更多是帮我们生成一个简单的小游戏,比如贪吃蛇、马里奥游戏。

但我们今天想生成一个游戏平台,让我们看看通过 Subagents 多智能体协同,如何让这件事变得更高效、更准确

Prompt:生成一个小游戏平台。需要包含游戏大厅、游戏入口,点击后进入二级菜单运行游戏,也可以单个游戏返回游戏大厅。游戏包括:

1.2048

2.flappy bird

3.扫雷

使用纯 HTML 实现,全部生成完成后统一验证。

👉点击查看视频

Case2:已有项目使用多智能体协同进行解读

在这个已有项目的分析解读环节,期望模型能够从多个角度来拆解项目,最后整理成一份 README,作为程序员大家都有体验,遇到一个新接手的项目,没有任何历史资料的情况下,我们很难对项目很好的理解和下手开发。希望通过多智能体协作的方式,帮助从多个角度解读项目,分模块告诉我有哪些部分,并且交给另一个擅长编写文件的智能体生成一份 README,这样让大家不仅能快速理解项目的整体目标和技术栈,还能清晰知道每个模块的职责、关键文件和启动方式,从而在新接触一个已有项目的场景中更直观地掌握项目全貌。

Prompt:帮我从多个角度解读这个项目,分模块的告诉我有哪些部分,生成一份 README

👉点击查看视频

Case3:为电商平台做国际化升级,AI Coding 辅助开发者快速实现页面翻译

随着品质国货在海外市场受到广泛认可,为国货出海创造不少新机遇

1.自定义智能体:翻译专家

你是一个翻译前端页面的专家,当前项目中的界面展示语言是中文,我希望整个页面能够被只会英文的用户使用。

修改文件过程请保持小块的修改,避免由于一次改动太大超过输入输出窗口,导致失败。

1.配置 Subagent:勾选翻译专家

2.输入 Prompt:使用翻译专家 Agent,翻译页面上的内容到英文。

👉点击查看视频

04 直播 Q&A 精选

Q1:多智能协同和传统单体 AI 最主要的区别和优势是什么?

A1:

  • 单体 AI 更像是一个“万能助手”,什么都能做一点,但在复杂任务中容易“力不从心”;而多智能体就像是一个“小团队”,每个智能体有明确分工,可以互相协作。

  • 优势

1.效率更高:不同 Agent 并行工作,整体速度更快。

2.质量更好专门的测试/优化 Agent 可以减少 bug、提高产出质量。

3.可扩展性能把一个大任务拆解成子任务,组合出更复杂、更完整的系统。


Q2:未来多智能体协同技术最令人兴奋的发展方向是什么?

A2:

1.智能体团队化一个人就能“带”一支虚拟团队,从产品到开发到测试都能自动化完成。

2.跨领域协作不仅限于写代码,还能在设计、运营、教育、科研等领域发挥作用。

3.自组织系统未来的智能体不只是被动执行,还能主动发现问题、提出改进建议,甚至形成“虚拟公司”的雏形。

4.人与智能体共创人类更像“导演”,智能体们是“演员”,这种模式会极大提升创造力和生产力。


Q3:作为一名开发者,该如何触发和使用多智能体协同功能?是需要复杂的配置,还是可以自然语言交互?

A3:并不需要自己去设计复杂的多智能体架构。一般来说,多智能体协同功能会被封装在代码助手或 IDE 插件的内部逻辑里,只需要通过自然语言交互触发即可。比如:

  • 直接提出一个复杂需求(“帮我实现登录功能,并生成测试用例”),系统会自动拆解任务并分配给不同的智能体协作完成。

  • 也可以通过简单指令来指定角色(“生成代码”“检查安全问题”“写测试”),由不同智能体分工处理。

  • 如果需要更细的控制,平台可能提供轻量级配置(如启用/关闭某类智能体,调整优先级)。

换句话说:默认情况下只需自然语言就能使用协同效果;如果你想定制工作流,通常会有简单的配置功能可供调整。如果再想调用更多能力,比如定制自己的 MCP 或者某些场景的 rules,可能才需要部分开发和调试工作。


Q4:在 Comate 的多智能体系统中,通常包含哪些角色,他们是如何分工的?

A4:

Architect 智能体

特点:不直接调用 Tools,仅能调用其他 Agent。擅长在多个 Agent 之间进行编排和分工,设计合理的执行顺序与依赖关系。通过高层次调度,让各个 Agent 协同完成复杂任务,确保整体产出符合架构与质量要求。

适用场景:跨多个 Agent 的复杂需求,如 端到端项目交付、涉及规划+编码+测试的综合任务,或需要统一把控规范与质量的场景。

Deep Read 智能体

特点:仅调用文件读取与目录分析工具,不会修改本地代码。能够深入解析项目逻辑、依赖与规范,快速提取核心信息并生成总结或解读报告。

适用场景:接手陌生项目、阅读复杂代码库、理解第三方库或遗留系统,以及需要快速建立上下文认知的场景。

Actor 智能体

特点:不与用户进行过多需求澄清,聚焦在编码实现,通过直接通过修改文件、调用终端,模拟开发者执行具体任务。

适用场景:需求清晰、任务明确的小型编码或执行任务。

Zulu 智能体

特点:启用所有内置 Tools 和当前项目安装的 MCP 工具,擅长自主探索用户需求、完成多文件编辑、端到端完成任务。

适用场景:代码结构复杂、文件改动量大的需求。

Plan 智能体

特点:擅长分析复杂需求,与用户协同澄清并完善需求,并将拆解步骤输出到 plan.md 文件中。通过提前梳理需求,确保后续生成的代码更贴合预期,提升整体效率。

适用场景:重构或需要完整规划的复杂需求。

UT 智能体

特点:识别代码结构和单测框架,自动生成符合项目风格的单测代码,同步提供覆盖率报告。帮助发现潜在 bug,提高代码质量。

适用场景:逻辑边界复杂、质量要求高的开发任务。

Figma2Code 智能体

特点:智能识别 Figma 元素,高保真还原设计稿,自动生成可运行的前端代码。大幅缩短设计到开发的周期。

适用场景:基于 Figma 设计稿的前端开发需求。


Q5:对于初学者来说,使用文心快码多智能体协同功能,是会更轻松地学会编程,还是会产生依赖?

A5:这是个很好的问题,如下:

  • 更轻松地学习:多智能体协同能帮初学者完成环境搭建、代码生成、自动调试,这样他们能更快看到成果,减少挫败感,带来“正反馈”,从而提高学习动力。

  • 潜在依赖风险:如果完全依赖智能体生成代码,而不去理解原理,可能会出现“能写不能改、能跑不能解释”的情况。

所以更推荐的方式是,对于初学者:

1.把智能体当作“助教”,用它来讲解代码思路、拆解任务。

2.先尝试自己写,再让智能体帮忙检查和优化。

3.关注学习过程,而不仅仅是结果。

作者:文心快码资深工程师,文心快码产品经理

用户头像

码随心动,快人一步,更懂你的智能代码助手 2025-06-18 加入

基于文心大模型,结合百度积累多年的编程现场大数据和外部优秀开源数据,为你生成更符合实际研发场景的优质代码。提升编码效率,释放“十倍“软件生产力。

评论

发布
暂无评论
“一人即团队”——一句话驱动智能体团队_AI 编程_Comate编码助手_InfoQ写作社区