「工作流 Agent」亮相百度世界大会,百度智能云千帆 AppBuilder 产品功能重磅升级
百度智能云千帆 AppBuilder 发版升级!百度智能云千帆大模型应用开发平台 AppBuilder 是面向各类水平开发者的大模型应用开发平台,帮助开发者高效、低门槛解决大模型应用落地最后一公里的问题。
在 AppBuilder 最新的 V1.0 版本,我们在工作流 Agent 中支持了对话流编排能力,满足有严格业务 SOP 要求的企业多轮对话场景(如客服、营销、咨询等);自主规划 Agent 提升了数字人能力及长文本处理能力,满足更丰富的应用需求场景。
本次更新重点:
Agent:工作流 Agent 新增对话流编排;自主规划 Agent 新增应用调优,强化长文本处理能力,优化数字人体验
RAG:上线图片召回功能;改善 Agent 路由到知识库的准确率
组件生态:优化生活及工作场景中的工具组件,满足不同场景需求
应用集成与分发:支持应用配置离线导入导出;新增网页嵌入渠道;支持工作流 Agent 与多模态 RAG 调用
平台体验:资源消耗可选择,广场改版升级,高效开发和优化应用
工作流 Agent 案例:
「金牌销售」车险续保 Agent,高拟人度对话引导客户续保 :
https://cloud.baidu.com/doc/AppBuilder/s/0m3fvj7r5
机票订单处理助手,实现机票的预订、改签和退票 :
https://cloud.baidu.com/doc/AppBuilder/s/1m3fo5hp3
更多更新详情,一起来看看吧:

1 Agent 全新升级
创建应用方式更新,上线强大的工作流 Agent
当前创建应用的模式分为自主规划 Agent 和工作流 Agent。
自主规划 Agent 为原来的应用模式,由大模型自主思考和回复;而新增的工作流 Agent 与自主规划 Agent 不同,它允许用户将真实的业务流程编排成工作流。
一旦业务流程被编排成工作流,应用就会严格按照这个工作流来运行,确保每个步骤都按照预定的顺序和条件执行。
工作流 Agent 支持多业务场景和多流程分支下的复杂多轮对话,确保了不同场景间的丝滑切换与无缝衔接,显著提升了对话的真实感和灵活性,满足客服、营销、咨询等有复杂业务 SOP 要求的多轮对话场景。
相较于自主规划 Agent,工作流 Agent 的可控性和稳定性更高,更加有效地限制了大模型思考和规划的幻觉。
另外,也可通过更精简的编排,减少大模型思考次数来提升应用响应时延。


工作流 Agent 支持多个节点配置:搭建意图逻辑更复杂、多轮对话信息传递更灵活的应用
意图识别节点:用于对用户输入内容进行意图理解和分类的节点。在对话系统或智能客服等应用中,用户的输入可能包含多种意图,意图识别节点能够识别并分类这些意图,从而帮助系统更准确地理解用户需求并作出相应的响应。同时,意图分类节点现支持自定义模型的 prompt,提高意图识别模型调优的灵活性。

记忆变量节点:用于在工作流中读取或写入全局记忆变量的节点。记忆变量可以存储用户在对话过程中的信息或状态,通过记忆变量节点,系统可以在工作流的不同阶段读取或更新这些信息,从而实现多轮对话信息的传递和状态的跟踪。

新增信息收集节点:该节点支持在工作流 Agent 中向用户提问,等待用户回复后抽取目标信息,满足客服营销等场景中常见的用户信息收集需求。

全局跳转节点:该节点支持在工作流 Agent 中实现话题的跳转及拉回,当用户发散问题、或回复不符合流程预期时,可跳转到新意图、知识库、闲聊,并在解决对应问题后,再拉回到原话题,满足多轮对话场景中常见的灵活话题切换需求。

全局跳转节点配置

全局跳转及拉回对话示例

知识库兜底对话示例
消息节点:该节点支持在工作流 Agent 的执行过程中向用户输出一条消息,满足工作流执行中的即时输出场景需求,在流程较长的工作流运行时,可即时了解当前进度或控制当前输出,提升用户体验与互动性。

文本处理节点:支持多个字符串的拼接或文本的分割,简化高频的文本处理流程。

API 节点优化:API 节点支持 headers 参数引用上游输出值,完善 API 接入的传参方式;同时,支持流式信息,降低应用的首字回复时延,提高终端用户体验。


工作流开放更多系统参数:为开发者提供更加丰富的系统参数,以增强文件处理能力、精准匹配用户或终端设备信息、高效进行系统异常检测,更好支持与外部系统集成。
end_user_id:终端用户的唯一标识,支持开发者通过 API 调用方式写入。
fileNames:用户在应用对话中上传的文件名称,便于在文件类组件中使用时指定对应文件。
conversation_id:会话的唯一标识,可以用于与终端设备进行关联。
request_id:本次请求的唯一标识,便于开发者对每次调用进行记录,快速定位调用的日志信息。
自主规划 Agent 升级
上线应用调优(知识干预):支持通过数据干预的方式对应用注入特定知识。
这意味着,当发现应用在某些方面的知识或响应不够准确或不符合预期时,可以通过此功能手动为其注入或调整所需的知识,从而提升问答准确性和应用效果。
提供可视化的运营管理平台,直观地展示用户点赞点踩反馈数据和线上对话抽取结果,运营人员可以更加准确地了解用户对产品或服务的看法和意见,从而有针对性地进行优化和改进,提高用户满意度。
系统支持对干预数据进行全面的处理,包括回流(将处理后的数据返回给用户或系统)、编辑(修改数据内容)、管理(组织、分类、存储数据)和导出(将数据从系统中提取出来,通常用于分析或备份)。

长文本处理能力提升:
提升角色指令输入上限:支持最大输入 3000 字,当 prompt 超限后自动切换为 128k 模型。
思考支持超长上下文模型:思考模型上线 Qianfan-Appbuilder-Lite-128k,提升 Agent 思考的上下文窗口至 128K。
数字人体验优化:
播报时支持自动打断:当数字人正在说话时,如果用户提出新问题并生成了新回答,系统将自动打断当前播报,优先播报最新回答。
新增形象 &音色:新增政企销售、医生和老师等形象(5 个女模特+ 2 个男模特及 6 个男生音色)支持更加丰富的企业服务场景,并对每个数字人形象新增使用场景标签,便于用户选择。


2 RAG 功能更新
图片召回:当用户问题涉及图片时,支持查看图片所在页面的文档截图。

英文检索优化:支持对文本中穿插的英文内容以及英文文献,生成中文知识点。
支持应用中自定义知识库描述:支持对知识库设置应用层面的描述,在思考模式下可根据自定义精准的知识库描述来选择调用知识库工具,提升 Agent 模式下知识库路由的准确率。

知识库和百度搜索组合 Agent 模式:单独选择知识库和百度搜索组件时,由二者都强制调用改为由 Agent 思考调用。
百度搜索组件 Agent 模式:单独选择百度搜索组件时,由默认调用改为由 Agent 思考调用。

3 组件生态优化
百度百科:整合百度百科超过 2800 万条的海量词条内容,用户可以进行高效搜索,获取丰富信息。

长文档内容理解升级:对组件的指令遵循能力进行了显著提升,以确保更准确地理解和执行用户指令。

百度电影升级:
输入参数中新增 top_k 字段,输出参数中新增 url 字段,以便提供更全面的电影信息和访问链接。

百度热剧升级:
输出参数中新增 url 字段,使其能够直接访问热门剧集的相关信息和资源。

必优论文生成 PPT 组件:
针对高校和科研场景,可将专业晦涩的论文生成便于传播汇报的 PPT,支持上传 docx 或 pdf 格式的中/英文论文,即生成可下载的 PPT 文件。

百度教育、作业助手组件:
针对 K12 场景,可提供全段各学科试题的精准答案搜索。


重排序组件:
支持将 RAG 召回的切片按照相关性进行排序,提升检索效果。(主要针对需要自主定义 RAG 中重排序环节的用户)


4 应用集成与分发优化
支持应用配置离线导入导出:
自主规划 Agent 支持用户将自主规划 Agent 的应用配置信息导出为配置文件,并再次上传成为一个新应用,以满足多应用的批量编辑、多开发者之间的应用传递、应用配置的本地存储等。

新增发布渠道-网站嵌入:
提供网站嵌入标准、快捷、低成本的集成方案,通过数行代码复制粘贴,即可将 AppBuilder 中的应用嵌入已有网站,支持 Web 门户(全页面)和 Copilot(聊天气泡)两种形态。

网站嵌入渠道入口

两种嵌入方式

全页面嵌入

聊天气泡嵌入
接口调用支持返回切片详细信息:
在 RAG 场景可返回命中切片关联的文档信息、所在文档页码、关联图片、命中内容在图片中的位置等信息,便于开发者在此基础上拓展出内容参考来源等更丰富的功能。
支持工作流 agent 调用:
可将调试好的「工作流 agent」通过 API/SDK 集成到用户的生产环境,至此,创建会话、文件上传、大模型会话接口同时支持工作流 agent(新增)+自主规划 agent(原有)。

支持多模态 RAG:
多模态 RAG 代码态和 GUI 界面功能拉齐,支持文件上传时进行图片解析+召回切片时带有关联图片 。



5 平台体验优化
支持消耗自有资源使用第三方组件:
组件开发者可配置终端用户使用组件的方式为「消耗开发者资源」或「消耗使用者资源」,增强组件开发者积极性。


广场新增精选筛选:
通过新增的筛选工具,开发者可以更快速、更精准地找到他们需要的组件和编排类型。

广场增加行业及场景精选样板间:
为了满足不同行业及场景的需求,广场增加一系列行业及场景精选样板间。目前已上线教育培训、媒体文娱、企业服务行业的精选应用。

精选应用新增搭建说明:
我们提供了精选应用的搭建说明,看完这些可快速上手搭建属于自己的应用。

真实查看最火应用:展示出最真实应用热度!点击卡片右下角,一键 get 同款应用。

新增智能云控制台总导航:加强百度智能云产品间的互联互通,使用户能够轻松访问和使用百度智能云的多个产品服务。

登录 session 延长:现在体验平台登录一次后,7 天内无需再次登录。
以上就是本次更新的全部内容。
📢 点击下方链接立即体验百度智能云千帆 AppBuilder V1.0 版本,开启你的大模型应用开发新篇章!🚀
https://console.bce.baidu.com/ai_apaas/dialogHome
👇扫描二维码 加入百度智能云千帆 AppBuilder 用户群👇

评论