AI 大模型加速 RPAxAI 时代到来,谁会是 RPA 领域的杀手级应用?
GPT 等 AI 大模型震撼来袭,基于 RPA 的超级自动化仍是最佳落地载体
对话弘玑 CPO 贾岿,深入了解国产 RPA 厂商对 AI 大模型的探索与实践
文/王吉伟
关于 RPA 已死的说法,在中国 RPA 元年(2019 年)投资机构疯狂抢项目之时就已经有了。
说它会死的,一般会认为 RPA 是一种过时的技术,一种打补丁的技术,一种不稳定的技术。在很多人眼里,依赖 UI 抓取实现的自动化,最终都会被基于 API 接口的集成自动化所替代。
现在已经过去 5 年,RPA 不但没有死,还进化出了智能自动化和超级自动化。
没错,RPA 没死是因为当代 RPA 都是基于 AI 构建的,几乎所有主流厂商都在推出 RPA 产品之前先一步进行 AI 的研发。
现在采用超自动化架构的 RPA 集成了 NLP、OCR、低代码、流程挖掘、chatbot 等几乎所有先进 AI 技术和工具,并且还在通过 UI 和 API 集成更多的技术以为客户提供更全面的端到端自动化解决方案。
当然,说 RPA 已死也是有道理的,因为没有融合 AI 技术的 RPA 早已经死了。
可谓生也 AI,死也 AI。
每隔一段时间,当 RPA 技术发展遇到瓶颈或者新技术会对其造成冲击时,就会有看衰 RPA 的声音出现,并再次提及 RPA 已死。
现在,以 GPT 为代表的 AI 大模型(LLM,Large Language Model)来了,ChatGPT 及 Midjourney 等基于 LLM 的杀手级应用对各行各业都造成了巨大的冲击,由不得大家不去考虑 LLM 对各种软件系统的影响。
于是,人们又开始探讨 RPA 的未来归宿。
起初就连 RPA 厂商也会为之恐慌,毕竟 LLM 都是巨头大厂才能玩得起的,有了 AI 大模型,主打 UI 自动化的 RPA 是否还有存在的必要?RPA 技术的发展是不是就到此为止了?AI 大模型会不会取代 RPA?(PS:关于 LLM 会不会取代 RPA,可以参考王吉伟频道之前的文章,本文不再展开讨论。)
扩展阅读:基于 AI 构建的当代 RPA,在生成式 AI 影响下的生命周期还有多长?
但通过一定的了解、探索与实践之后,厂商们很快就发现 LLM 将为 RPA 带来的巨大变革与全新机会。于是,国内外 RPA 厂商都在步调一致地积极引入 LLM。
目前国外引入 GPT 的厂商已经有十数家,国内也有多家厂商引入了 GPT、文心一言等大模型,未来国内各个发布大模型的厂商都将是 RPA 的模型供应商。
那么,目前都有哪些国内 RPA 厂商引入了 LLM?GPT 等 AI 大模型又会为 RPA 带来什么样的变革?大模型能够为 RPA 厂商带来哪些机会?
本文,王吉伟频道就跟大家聊聊这些。
国内 RPA 厂商的 GPT 探索
RPA 在 GPT 上探索与尝试,先是由国外 RPA 厂商开启的。
ChatGPT 上线于去年 11 月 30 日,到了今年 1 月,智能自动化厂商 NICE 就率先宣布了与 ChatGPT 的技术集成。此后 Automation Anywhere、UiPath、三星 SDS、Appian、SAP、Pega 、Salesforce、微软(Power Automate)等多家厂商都官宣或者发布了 GPT 插件,并在博客或视频平台上线了相关教程与视频。
保守估计,国外市场引入 GPT 的 RPA 厂商已经不下 20 家。
在国外厂商的引领之下,国内也有很多厂商陆续引入与集成 AI 大模型。
近期国内也有不少厂商,发布了 RPA 与 GPT 结合的 demo 视频。比如在这个周一,通过内部独家接触,王吉伟频道就看到了被 Gartner 评测国内 RPA 产品力第一的弘玑 Cyclone 所发布的 9 个 RPA 与 GPT 结合的 demo。
其中三个 demo,王吉伟频道印象非常深刻。
第一个是 GPT 与 RPA 结合的大众点评商家智能助手,原来需要多步操作的复杂工作流程,现在只需一个自然语言口令启动便可快速执行。
第二个是 GPT 结合 RPA 实现周报自动书写和发送,GPT 通过分析 RPA 自动获取的项目日报和项目管理系统中的信息,通过与用户多轮对话生成具有实时数据支持的精确项目周报。
第三个是 GPT 结合 RPA 结合事实资料自动生成 Word 和 PPT,RPA 提供真实信息数据来源有效避免 ChatGPT 凭空编造内容,几秒完成重复繁琐的资料收集、整理、生成定制化文案与 PPT 的工作。
弘玑这次发布的 demo,侧重 GPT 与 RPA 各种能力的有机融合,包括环境感知、数据获取、 数据处理、数据搬运、内容生成、智能决策、信息系统与应用的自动化操作等。
看完这些 demo,可以深刻感受到基于 LLM 的 AIGC 与 RPA 深度结合所带来巨大技术变革。
而从厂商们在 LLM 方面的各种动作上,也能感受到整个 RPA 行业 AI 大模型融合趋势已经奔流不息。
既然聊到 RPA 引入 AI 大模型,顺便也说说大家关注的如何引入大模型的问题。
在 LLM 技术的引入与研发方面,不管厂商们推出何种形式的产品,目前应用 LLM 一般有三种方式:
第一种是直接调用 API。厂商们会根据需要直接调用 GPT、文心一言等国内外模型的 API,也是最简单的集成生成式 AI 的方式,很多企业的软件系统都可以快速以这种方式引入生成式 AI。
第二种是私有化部署+模型微调。把模型厂商开放的模型部署到本地或企业云后,将其优化为一个预训练的面向企业所在领域的大模型,利用 prompt(提示词) 的方式去引导模型生成领域场景化的内容。由于数据安全的需求,目前大型企业都在用这种方式引入模型。
第三种是面向特有技术或者业务模式的原生模型研究,在 RPA 领域这样的模型一般是面向 automation 的原生模型。除了引入外部 AI 大模型之外,目前很多厂商都已经在自有模型方面做了相应的投入与研发。同时因为当代 RPA 是与 AI 融合的产品,厂商们也在持续对相关的 AI 架构、模型等进行研发。
需要说明的是,因为不同厂商对业务流程、产品理念、技术趋势等的不同理解所造成的风格迥异的自有原生模型,也是其核心竞争力之一。
AI 大模型的应用,再次证明当代 RPA 与 AI 技术连接与融合的紧密性。当然,随着更多 AI 厂商引入 ChatGPT 等生成式 AI,RPA 产品也开启新的 AI 大模型变革之路。
LLM 重新定义 RPA
上面介绍的 RPA 厂商应用 AI 大模型的三种方式,来自于王吉伟频道与弘玑 Cyclone CPO 贾岿博士的交流。
贾岿博士在硅谷工作了二十余年,在微软、亚马逊、思科、UiPath 都担任过重要职位。基于其对硅谷科技发展以及 AI 技术的深入了解,他对 LLM 如何影响 RPA 有着独到的见解。
在贾岿博士看来,RPA 与 GPT 的融合并不是简单叠加,而是一种深刻的变革。
大家知道,让 RPA 机器人取代人去稳定操控 PC 桌面的难度很高。RPA 要处理的事情比 Office 应用操作复杂得很多,它面向整个桌面上各种各样的 APP,会遇到各种各样的干扰,是一个非常复杂的操作过程。
目前的 RPA 产品已经非常成熟,但在体验上仍会出现各种各样的问题。要真正达到像使用 office 一样丝滑地使用 RPA,还有相当的距离。
但随着 GPT 这类多模态 AI 技术的引入,RPA 之前所遇到的很多问题都将被解决。GPT 等 AI 大模型和现有的 RPA 技术的模态进行重组,在强化学习、多重决策、虚拟人等技术的加持之下,RPA 在智能方面开始从感知智能进入初步的认知智能。
RPA 会对人的意图有真正的理解,然后帮助用户做一些决策,并在执行任务时产生越来越多的预生成算法类推荐指导,让用户可以更简单地通过自然语言交互进行 RPA 开发。
因此融合 LLM 技术的下一代 RPA ,在用户体验上会有一个质的飞跃,RPA 将会变成真正意义上的数字员工。
以上说法过于学术和技术,更简单的理解是,现在的 RPA 像一个加了几个基本传感器数字手指,GPT 的接入则让 RPA 多了一个头脑。
RPA 与 GPT 相结合,相当于把“手(RPA)”“脑(GPT 带来的内容生成/意图理解/智能对话/决策)”“眼(OCR/CV)”“耳/嘴(chat 对话)”各种能力进行有机结合,自然能够为广大组织带来更智能的 RPA 数字员工。
事实上,AI 大模型的引入为 RPA 带来的远不止多了一个大脑,更是带来了深度的产品变革。
自 RPA 诞生开始,厂商们无时无刻不在探索如何通过更好的技术去实现屏幕抓取。但屏幕抓取、视觉识别如何发展,却始终脱离不了拖拉拽或者搭积木的产品形态。
引入 GPT 之后,用户就可以通过自然语言交互驱动 RPA 的流程创建,以及生成各种各样的结构化数据。这意味着以后用 RPA 开发自动化应用程序可能再也不需要拖拉拽或者写脚本了,也意味着用 AI 生成的结构化数据会替代更多的非结构化数据,同时在非结构化数据转化方面比现在的 OCR 要快速高效得多。
简单地讲,数字经济或者数字运营,就是所有信息化系统以及数字化业务都是数据的衔接交互、计算处理与分析决策的过程,基于 RPA 的超自动化则实现了让整个过程实现自动化运作。
RPA 结合 GPT 之后,自动化的整套逻辑改变了,处理数据模式改变了,人机交互的形式改变了,业务运作流程也改变了,甚至就连企业信息化架构以及组织框架都会跟着改变。
也就是说,GPT 等 AI 大模型将会由内而外地变革 RPA 的产品形态,也会进一步加速组织运营中的自动化生态的变革。
GPT 落地的最佳载体
在人机交互上,GPT 等大模型为组织经营带来的最大变化,是改变了人们操作软件系统的模式。人只需要跟 GPT 交互,多模态 AI 在理解人类操作意图后,进一步驱动组织企业管理软件的自动化执行各种业务流程。
对 RPA 来说,RPA 以 UI 自动化和 API 自动化组合的形式连接了支撑组织业务运营的各种企业管理软件系统,GPT 等 AI 大模型则进一步连接了人与 RPA 等系统,让操作更加简单。
GPT 向上连接人的意图,向下指挥 RPA 机器人,成为人和 RPA 等自动化系统之间的一个纽带。GPT 把人和基于 RPA 的超自动化连接起来,第一次让 RPA 通过自然语言理解了人的意图,这是人机交互体验上一个巨大的进步。
这同时也意味着,未来对所有企业管理软件的操作,可能就是打一行字或者说一句话。
这个事情,RPA 厂商们正在做。目前厂商们推出的 GPT+RPA 应用,基本都能通过输入几句话实现调动 RPA 机器人执行任务或者创建相关程序。
需要说明是,现在已经出现了一些基于 GPT 的使用自然语言创建应用的 SaaS 类产品,比如 OpenGPT、Prisms AI 等,包括基于 GPT-4 的 ChatGPT 已经可以直接运行生成的代码程序。
但这些都是简单的独立应用,并不能像融合 GPT 的 RPA 一样能够创建面向连接多个企业管理软件的自动化程序。并且以后生成式 AI 创建的程序会以倍数增长,这些程序都将被嵌入到企业运营的工作流中,就更需要 RPA 等工具将其串联到自动化流程中。
换句话说,以后由 AI 生成的大量应用都要借着基于 RPA 的超自动化嵌入组织业务流程以实现最终落地。这样,融合 LLM 的 RPA 就显得更加必要和重要。
自动化业务流程是 RPA 的专长,GPT 等 AI 大模型则让这个专长更加快速、高效和稳定。
GPT 的特点是自然语言理解和生成内容,并不能直接驱动大量的企业管理软件,大量的自动化业务操作还需要借助企业原有的自动化生态系统,因此 GPT 的落地就更加需要基于 RPA 的超自动化能力。
一直以来王吉频道都有一个的观点:RPA 是 AI 落地的最佳载体。
对于 AI 技术而言,自动化系统是很好的落地载体,毕竟 AI 存在的一个重要意义就是为了实现人类的终极自动化愿景。因此,大量组织已经构建的基于 RPA 的流程自动化体系,也就成了 LLM 的更好的落地载体。
未来不只是 GPT,多家大模型厂商的 AI 技术都要借助基于 RPA 的自动化等载体更好地落地。
而当 GPT 与 RPA 真正落地之后,其为组织所带来的就远不止 RPA+AI 那样简单了。
从 AI+RPA 到 AIxRPA
当代 RPA 的发展基于 AI 技术,这点早已人所共知。自 2019 年中国 RPA 元年开始,RPA 领域在探索的都是 RPA+AI 或者 AI+RPA。
事实上 RPA+AI 有两层意思:一是表示现在的 RPA 产品中都包含 AI 技术,RPA 正在借助 AI 实现新的发展,有了更强的能力和更多的应用场景;二是 RPA 产品一直在持续融合各种最新 AI 技术,超级自动化架构出现更是把这一点发挥到了极致,现在它还在不断纳入与 RPA 相关的最新技术,包括目前的 AI 大模型。
在 RPA 与 AI 的融合发展上,相对于过去 5 年的 RPA+AI,贾岿博士提出了一个新的概念:RPAxAI。
他认为,在 LLM 之前,RPA 一直在做叠加 AI 技术能力的事,现在它所融合的 OCR、NLP、流程挖掘、低代码、Chatbot 等都是 AI 技术的一部分或者基于 AI 的工具或平台。但不管怎么去叠加这些技术,对于 RPA 而言,AI 技术都是嵌入式或者外挂的存在。
现在有了 GPT 等 AI 大模型就不一样了,GPT 将变成用户与 RPA 之间的智能连接器。用户用自然语言将需求告诉 GPT,GPT 能够理解用户的意图并将之转化的命令,传达并指挥 RPA 去执行各种任务,将用户需求转化为具体执行并反馈结果。
所以,与之前 RPA+AI 在做加法相比,现在的 GPT 与 RPA 的结合是在做乘法。做乘法的意思是,用 GPT 等大模型原生的方式去驱动 RPA 的模式将会成为新的智能 RPA 范式以及自动化运行模式,AI 大模型以及未来的通用人工智能将会成为 RPA 不可分割的一部分,也将会成为 RPA 的核心构成部分。
大模型作为多模态通用人工智能,会替代目前 RPA 已经“+”的 CV、OCR、NLP、Process Mining 等多种 AI 技术。未来一个多模态 AI 技术就能胜任 RPA 对各种 AI 技术的需求,RPA 也就不再需要去“+”当前各种各样的零碎 AI 技术。
也就说,LLM 为 RPA 带来的是 AI 能力大一统的时代,RPA 不再需要像打补丁一样去集成各种技术。这同时意味着,RPA 已经离不开 GPT。
现在主流 RPA 厂商基本都引入了 GPT 或者相应的 AI 大模型,当 GPT 所带来的自然语言成为用户与 RPA 交互的主要方式之后,更快的效率、更稳定的运行以及更好的体验,将会让人们将再也离不开它。下一代 RPA 如果没有 GPT,从技术到设计再到运营等都将无所正常运行。
所以 RPA 与 GPT 等大模型的结合将会产生指数级的化合反应,对比之前的 RPA+AI,这种技术样态、产品形态、运作模式以及商业生态完全可以总结为 RPAxAI。
在王吉伟频道看来,RPAxAI 除了展现出 AI 为 RPA 所带来的深刻变革以及 GPT 已经成为 RPA 必需,更意味着数字生产力的跃升,极简操作、更好体验、更高效率以及更低成本的融合 AI 大模型的超级自动化产品和企业级解决方案,将会助力广大组织基于自动化完成数字化转型的进一步蜕变。
后记:LLM 带来的企业级 RPA 机会
技术说破天,最终呈现给客户的还是能不能打造出安全、稳定与高效运行的 RPA 系统,这也是衡量厂商企业级 RPA 能力的关键。
企业级的 RPA 指的是一个成规模的产品、技术与服务体系,其中既有技术的深度,也有解决方案的广度,更有各种服务的厚度。比如软件集群技术能不能正常应用于大型企业的核心系统,会不会因为安全问题或者不稳定因素造成客户损失,能不能帮助企业实现成规模部署等。
而一旦涉及规模化部署,就需要厂商需要更强大的编排能力、调度能力和管理能力。
很多时候,企业级 RPA 的能力体现在厂商为单一客户部署 RPA 机器人的部署体量上。比如 UiPath 已经帮助安永部署了十几万个 RPA 机器人,在国内弘玑 Cyclone 也已经有机器人部署数量达到几万个的客户。
之所以提及企业级 RPA,是因为 AI 大模型能够为其带来更大的应用与商业价值。LLM 的引入进一步降低了 RPA 的开发难度,提升了 RPA 的运行效率,加强业务流程自动化的稳定性,并解决了原本存在的因 RPA 力不从心导致的开发环节中冗余复杂问题。
在 AI 大模型与 RPA 的具体结合上,目前弘玑 Cyclone 在做的是通过模型微调技术,将 GPT 和原有的以及新开发的组件封装在一起,构成多个具有高度场景化与参数化的智能组件,并通过自然语言或者 API 去驱动。
这种方式,将会成为下一代 RPA 的基础构建能力。贾岿博士透露,目前他们已经开发了几十款智能 RPA 组件,上半年能够开发上百个智能 RPA 组件。
从目前各家厂商放出的信息来看,智能组件已经成为 RPA 产品的主流模式。可以想象,当所有厂商提供的融合 LLM 的智能组件在更多的企业中应用,那将是一个什么样的场景。
事实上,对于 LLM 对 RPA 的影响,红杉资本早在《Generative AI: A Creative New World》文章中给出了启示。该文中给出的生成式 AI 平台应用程序市场格局图中,特别提到了 RPA。
王吉伟频道认为,这里的 RPA 更多的是指企业级 RPA,并且也只有企业级 RPA 才能更好的发挥出 LLM 的优势。
LLM 加强了 RPA 的企业级能力,也让更多企业重新燃起对 RPA 的兴趣,并对大规模部署 RPA 有了更多的信心。无疑,这将进一步提升 RPA 在各领域的渗透率以及厂商们的市占率。
而随着企业级 RPA 在更多业务场景的快速落地,广大组织也将能够基于流程自动化实现更有成效的数字化转型,对于其持续追求的增效降本有着重要意义。
同时,更简单的人机交互也将 RPA 人人可用的愿景照进现实,轰轰烈烈的全民开发时代也正式拉开了帷幕。
AI 大模型给了厂商们重新定义 RPA 的机会,也实现了更多组织简单、快速、高效、安全应用流程自动化的愿望。
一个崭新的 RPAxAI 时代已然到来。
【王吉伟频道,关注 AIGC 与 IoT,专注数字化转型、业务流程自动化与 RPA,欢迎关注与交流。】
版权声明: 本文为 InfoQ 作者【王吉伟频道】的原创文章。
原文链接:【http://xie.infoq.cn/article/b21b9fa94a82b2c1192682889】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论