写点什么

为什么说 RPA Agent 是企业智能体落地首选?一篇文章告诉你答案

作者:王吉伟频道
  • 2025-10-19
    山东
  • 本文字数:5393 字

    阅读完需:约 18 分钟

为什么说RPA Agent是企业智能体落地首选?一篇文章告诉你答案

全文约 5000 字,阅读时间 10 分钟

智能体的应用热度,也体现在相关政策文件中。

8 月下旬,国务院发布的《关于深入实施“人工智能+”行动的意见》明确提出,到 2027 年实现新一代智能终端、智能体等应用普及率超过 70%,到 2030 年超过 90%,到 2035 年我国全面步入智能经济与智能社会的新阶段。

9 月中旬,工信部等七部门联合印发了《深入推动服务型制造创新发展实施方案(2025—2028 年)》政策文件。在“夯实服务型制造发展底座”的任务说明中明确提出,推动人工智能技术与服务型制造融合创新,引导通用大模型、行业大模型和智能体在重点场景布局应用。

政策的发布,为智能体的发展与应用按下了加速键,也让更多人看到了企业应用的发展方向。越来越多的人开始关注智能体,更多的企业则在考虑是否引入智能体应用。

但应用智能体并非简单的技术叠加,贸然引入定会出现难以预料的情况发生。最近 MIT 调研 300 多家正在进行 AI 转型企业后的报告结果显示,竟有高 95%的项目没有获得任何回报,只有 5%的项目真正创造了商业价值,甚至有些企业的 CIO 因此被裁撤。

当前阶段企业应用智能体主要面临五大痛点问题:技术上,模型幻觉、安全漏洞频发,且难与现有系统集成;业务上,盲目选场景、ROI 难量化,流程重构阻力大;成本上,算力供需失衡,中小企业投入门槛高;合规上,隐私法律冲突多,数据质量差且孤岛化;组织上,员工抵触情绪重,复合型人才短缺。

想要解决这些问题,可以从低风险场景切入,可以用小模型+RAG 提升准确性,还可以从建立人机协作 SOP 入手。但重点在于,能否找到合适的技术供应商和适配的解决方案。

企业要引入智能体,落到业务和技术层面,就是将企业现有的业务软件、数据与管理系统及技术架构与智能体技术相揉捏到一起,最终形成一个融合智能体的业务流程体系。这就需要在已有的业务流程系统中,寻找一种技术或者软件应用作为切入点,与智能体实现完美融合。

理论上,推出智能体的 ERP、CRM、BPM、workflow、BI 等软件都可以充当这个切入点,但王吉伟频道更推荐首选 RPA Agent。为什么这么说呢?且看下文。

契合企业智能体需求

企业对于新技术的应用,并不是一蹴而就的,而是一个不断累加、验证与取舍的过程。对于大模型和智能体的应用,自然也是一样。

传统企业是很多人组成一些部门,结合信息化系统来构建的组织。在 RPA+AI 到来后,变成了人+RPA+AI 的人机协同。接下来随着智能体的普及应用,组织会变成人+智能体的人机协同,少量的人与大量的智能体协同工作,大量智能体在网络上对接数据与服务,所有人与工具都围绕 AI 来工作。

在这个趋势下,所有组织或者个人都将主动或者被动应用智能体,就像你的客户使用某个平台你也必须使用一样。

追本溯源,从业务流程角度,智能体所做的仍然是业务流程自动化的事。具备自主性的智能体动态化的替代和消除了原有的流程节点,让原本的多线条流程不断缩短乃至消失,也让自动化程度不断提升。

智能化为自动化赋能,智能是因,自动是果,企业对于稳定可靠自动化的需求,远大于对更先进的智能化技术的需求。企业应用流程自动化的进程,从企业对于 RPA 应用的阶段化发展可以体现,见下图。

所以当智能体已经在大街小巷被谈论的时候,有些传统企业、大型企业可能还在实施 RPA2.0 向 RPA3.0 的跨越,因为它们需要成熟与稳定的技术支撑业务,未经大规模验证的新技术无法适配规模化生产。当然随着传统软件的智能体化,它们最终都能借助 RPA Agent 或者企业 Agent 实现 Agentic AI 对业务流程的赋能。

▲点击看大图

在 RPA 应用的进程中,RPA 的一个重要作用是粘合与连接,使得企业过往重金投入、却缺乏现代 API 接口或不愿额外开发接口的旧系统能够继续使用,这个应用到现在都是主流,也体现了 RPA 在某些应用场景的不可替代性。

过去 10 年,很多企业的业务流程里都增加了一个“人+RPA”的人机协同层。对于大量应用 RPA 的企业,会考虑如何如何把 RPA 与智能体关联融合,一般不会推翻现有信息系统而引入智能体。面向真正的企业运营场景,抛开 RPA 去谈智能体都是耍流氓。因此,基于 RPA 的智能体解决方案更契合需求。

此外,目前还处在智能体应用的初期阶段。别看现在 C 端的智能体表现多么亮眼,面对 B 端企业五花八门的异构系统和个性化需求,大部分解决方案都是白搭。

在王吉伟频道看来,智能体距离直接操作企业深层复杂的长业务流程还有一段不短的距离,所以用智能体连接原有系统是企业应用智能体的最优路径,比如先搞个 Agentic RAG 企业知识库等等。某种程度上,在企业应用端,当前的智能体很像多年前的 RPA。

稳定性更胜一筹

智能体的稳定性决定它能否大规模应用,目前仍然存在很大的挑战。过去半年,C 端市场涌现出了不少表现优异的智能体,比如 Manus、Loveart、Tunee 等。B 端也有不少令人青睐的开源项目,比如 Dify、n8n、Coze 等。尤其是 n8n,已经被很多人说的无所不能。

n8n 以构建 Agentic Workflows 著称,理论上没有它不能连接的 API。只要 API 足够多,它就能实现足够长的工作流。但问题在于,API 越多也意味着工作流更脆弱,一个 API 故障就会导致整体瘫痪。加上大模型存在幻觉,相同提示词可能产出不同结果。

▲n8n workflows

个人使用可反复运行调整,企业生产中一次中断就可能导致停摆,因此企业不敢轻易尝试。冗长的工作流,还会加剧 token 消耗、增加 API 成本,进一步放大稳定性问题。

所以,用更少的 API 构建更长的工作流能够更稳定地运行,才是智能体工作流的上上策。

RPA 之所以能够在广大企业中盛行,一个重要原因是在于进化出了“人工模拟+API”的双重连接模式,可以最大程度保证软件系统之间交互的稳定性。在人工模拟这个单元,还引入了计算机视觉,比如实在智能的屏幕识别(ISSUT)技术,进一步增加了 RPA 的安全筹码。

PC 是智能体必然要攻克的高地,也将是智能体的必争之地。微软、OpenAI、Antoropic、腾讯、阿里、字节跳动、智谱等很多大厂都在持续跟进 Computer Use Agent(CUA),最近谷歌也发布了 CUA 大模型。

CUA 用的基础技术之一也是计算机视觉,它通过截图等方式定位 PC 屏幕坐标并让键鼠模拟人类操作 PC。多模态大模型的应用正在让 CUA 进化的更加丝滑,但仍旧无法媲美 RPA Agent。

一些厂商也研发了结合 RPA 的 CUE 开源项目比如 APA 等,以推动 CUE 早日得落地应用。实在智能融合 RPA 相关技术基于自研塔斯模型的同类产品实在 Agent 智能体,在 2023 年率先发布时已是可大规模商用的企业级产品。

目前市面上的四类智能体

经历了 2 年多的发展,在科技巨头探索和开源领域努力及市场需求增长的共同作用之下,尤其是在具备深度规划能力的 RPA Agent 出现之后,从技术和应用角度来看,目前市面上的智能体大体可以分为四种,如下:

▲点击看大图

1、让大模型扮演某种角色的智能体:直接利用大模型的生成能力完成特定对话任务

类似 Kimi、豆包这种智能体,优点是简单易用,门槛低。这种类型是最基础的纯大模型类智能体,直接调用大模型的基础能力,也在随着“模型即应用”的趋势而逐渐变强。

2、大模型与 API 技术结合的智能体:基于预定义的工作流实现特定任务的标准化执行

类似 coze、Dify 智能体平台。相对纯大模型类智能体,这类智能体优点是可以完成简单流程串联,也可以编写执行长任务,对于有 API 接口的调用方便,进一步拓展了企业端的应用。

但它依赖 API 的缺点也比较明显:泛化能力较弱,开发 API 成本高,有些老旧的系统甚至可能没有 API,且开发 API 的成本和时间周期都是依赖于 IT 团队能力和人工,效率相对较低。

3、大模型与 MCP 技术结合的智能体:基于任务的理解自主规划工作选择工具进行执行

类似 manus、Claude 智能体,相较 API 接口开发,调用十分便捷。MCP 服务颗粒度如果做得太细,性能就会比较差;如果颗粒度太粗,就无法去做精准的调控,可控性存在一定问题的。

4、大模型与 RPA\API\MCP 融合具备深度规划的智能体:基于任务的理解自主规划并与人工协作操作桌面

类似实在 Agent 智能体,融合了 RPA,把对于操作系统的底层操控能力原子化,具备操控上的完备性。增强了 ISSUT 屏幕语义理解能力及流程垂直大模型的能力训练,在流程执行上比 GPT4O 还高 7 个百分点。

同时具备深度规划能力,能够自主完成目标人物的规划→执行→验证→交付全闭环。这类智能体更加自主、智能、稳定、可控和高效,符合无论是个人还是企业业务流程的生成和执行的智能体需求。

四种智能体各有优势,在不同业务场景发挥各自作用。但在企业生产环境中,第 4 种类型能够快速、高效、稳定的连结与融合企业原有基于 RPA 等系统的业务流程,更容易被集成到企业复杂的业务系统中。尤其是能够通过人工模拟和 API 双重模式连接各软件系统的 RPA Agent,是目前的主流解决方案。

国内 RPA Agent 新动态

RPA Agent 已经成为 To B 领域的一支重要力量。目前 UiPath、Automation Anywhere 等海外大厂都推出了融合 RPA 的智能体产品或者解决方案,国内如实在智能、金智维、容智信息、来也科技等也都推出了相关产品。

在国内,实在智能的智能体产品研发和应用进展一直保持领先。关注和研究实在智能,能够列了解国内 RPA Agent 的最新发展动态。最近实在智能最新发布了实在 Agent 智能体 7.2.0,我们来了解一下。

实在 Agent 升级迭代的 7.2.0 版主要是全球首发了深度规划功能,能够让智能体像人一样边想边做。深度规划功能,让智能体的思考、规划、推理分析与工具应用能力大幅提升,解决了很多以往智能体存普遍存在的问题。具体表现为以下四大核心能力,下面结合具体案例跟大家介绍。

1.深度推理:全流程透明化,逻辑可见。通过“目标解析→任务拆解→工具匹配→确认执行”四步,将 AI 的规划思路与执行逻辑完整呈现,避免“指令进、结果出”的黑箱问题。


案例 1:收集京东手机商品名称和价格。输入需求指令后,它会把任务深度规划为获取京东商品数据、生成 Excel 表格存到桌面、使用钉钉发送文件给文件小助手 3 个子任务,并按照步骤执行。任务完成后,就会在钉钉上把 Excel 数据文件送给小助手。用户可以看到浏览器操作、Excel 生成、钉钉发送的全过程。这种跨软件应用的操作,目前仅有 RPA Agent 能够丝滑执行,Coze 空间等类 Manus 智能体尚无法实现。

2.多工具与智能体调度:复杂任务协同闭环。无需用户手动搭建工作流,实在 Agent 可主动识别任务需求,调用不同类型的智能体与工具,实现多环节协同。


案例 2:设计制作 PPT 模板并微信发送。输入需求指令让它制作 PPT 模板并发送到微信传输助手,它会主动识别任务需求,将其深度规划为 3 个执行步骤,先调用工具生成试用期总结 PPT 模板,把模板保存为本地文件,再打开微信找到文件传输助手,精准选择模版文件发送给文件传输助手。

3.自我验证纠错:避免任务中断与“幻觉”输出。包括两大核心作用:一是识别执行障碍(如权限、环境问题),二是修正输出偏差(如数据源错误),确保任务准确闭环。


案例 3:小红书提取 iPhone 17 舆论。让实在 Agent 在小红书提取 10 条关于 iPhone 17 的舆论,它会将任务深度规划为 3 个执行步骤。首先会在桌面建立一个任务文件夹,建立一个空的任务 Excel 表格。然后通过内置浏览器打开小红书网站。如果用户没有登录,任务执行遇到障碍,它会主动提示用户登录小红书,用户登录后继续执行任务。最后遍历小红书上符合条件的内容,把相关数据提取到表格中。

4.代码生成可视化:提升报告可读性与效率。针对冗长文字报告,自动生成 HTML 网页代码(集成 Tailwind CSS、Font Awesome 图标、Google Fonts),将信息转化为直观的可视化格式。


案例 4:生成 AI Agent 网页报告。输入需求指令,它会别任务需求并将其深度规划为 5 个执行步骤,调用工具收集 AI Agent 产品、市场及相关企业的信息,整合数据生成研究报告,最后调用网页大师智能体把研究报告内容转为可视化的网页格式。

实在 Agent 凭借类人大脑的思考逻辑,让用户无需预先设计复杂流程,仅需明确任务目标,自主完成规划→执行→验证→交付全闭环。这种类人类思考模式,打破了传统“人思考、机执行”模式,解决了传统智能体黑箱操作、流程依赖、易输出幻觉数据等核心痛点。它能够实现让智能体覆盖各类跨系统、多步骤的办公场景,无需学习复杂流程降低了用户操作成本的同时,又能通过避免幻觉数据提升任务准确性,还能通过自主协同闭环提升效率,进而满足企业对于高可靠、无幻觉、高效率智能办公工具的核心需求。

同时它无需接口也能完成负责任务,没有虚拟机也能操作系统软件,破除了大模型幻觉,能够精准落到任务执行的每一步,构建工作流效率高且复用性强,是当下最实用的智能体商用落地方式。它既为企业应用“自主+可控”的智能体打下了基础,也拥有着巨大的商业潜力。

后记:合适方案加速智能体落地

Gartner 在今年 1 月预测,到 2027 年末,超过 40%的 Agentic AI 项目将因成本持续攀升、商业价值不清晰或风险管控不到位而终止。

原因在于,当前多数 Agentic AI 项目仍处于早期实验或概念验证阶段,这类项目多受市场炒作推动,且常被误用。这容易让企业忽视大规模部署 AI 智能体所需的实际成本与技术复杂性,最终导致项目无法落地到生产阶段。

企业要将 Agentic AI 集成到现有系统的过程中,不仅会面临复杂的技术难题,还需频繁调整工作流程,且需承担高昂的修改成本。

王吉伟频道认为,其实想要破解这个问题也不难,就是基于现有企业软件系统和业务流程设计 Agentic AI 工作流程,或者寻找能够将其融合的 Agentic AI 解决方案,让智能体真正能够落地到业务流程中。

因此专注做业务流程自动化、业务流程管理等企业服务厂商所推出的 Agentci AI 解决方案,将会是一个更好的选择,不妨多关注一下实在 Agent 等 RPA Agent。

【王吉伟频道,关注 AIGC 与 IoT,专注数字化转型、业务流程自动化与 AI Agent,欢迎关注与交流。】

发布于: 刚刚阅读数: 3
用户头像

还未添加个人签名 2020-11-11 加入

王吉伟频道,关注数字化转型,专注业务流程管理与RPA。

评论

发布
暂无评论
为什么说RPA Agent是企业智能体落地首选?一篇文章告诉你答案_王吉伟频道_InfoQ写作社区