个性化、自主化数据分析|Agentic AI 的前世今生
引言
随着大模型和生成式 AI 的发展,AI Agent 成为 2024 年底 AI 领域最火热的话题之一。LangChain 发布了“State of AI Agents in 2024“ (https://www.langchain.com/stateofaiagents)的调查报告。
报告显示,Agent 技术在实际业务场景中的应用正在逐渐开始加速。
本期,我们邀请质变科技数据科学家、AI-ready 数据云团队布道师则明为大家分享系列话题《Agentic AI》,分别从 Agentic AI 的发展脉络、技术架构和当前开源社区所提供的支持,以及具体的商业应用等方面进行分享,本篇是 Agentic AI 系列的第一篇。
AI Agent 的基本特征
AI Agent 概念本身并不新鲜,本质上是一个探索如何通过计算及模拟人类智力活动的思考框架。Agent 本质上有以下几个基本特征:
1.自主行动:Agent 一旦训练和部署完成,能够自主进行决策和行动,而无需人工进一步干预。
2.环境感知:Agent 能够(主动或被动)获取其执行环境的各种上下文信息。甚至能以多种模态接受和处理环境信息。
3.工具使用:Agent 在完成任务的过程中,能够通过工具使用的能力与各种系统进行交互(包括其他 Agents)。
随着 AI 技术的发展,Agent 能力也获得进一步提升:
4.多方协调:Agent 能够自主的与其他智能系统或 Agent 配合生成全局计划以完成各种任务。
5.自主学习:Agent 能够从过往的任务经验和反馈中获取所需要的数据,对自身进行改进,从而进一步提升任务性能。
在人工智能的发展史上,曾经出现多种技术为 AI Agent 提供支撑,比如 70~80 年代的专家系统,通过基于规则的推理来模拟人类专家在特定领域的决策行为。在基于统计的机器学习兴起之后,AI Agent 能从大量数据中自动学习和发现特定的模式和规律,减少了对(人工)规则的依赖。而神经网络和深度学习的兴起则进一步提升了 AI Agent 在自然语言、语音图像等多模态数据上的性能。
大模型时代 AI Agent 的智能增强
随着预训练大模型的兴起,AI Agent 进一步得到了增强,主要体现在以下几个方面:
1.CoT & Planning:思维链及其相关的衍生技术进一步提升了 Agent 计划制定的泛化能力。通过对复杂问题的拆分,ReAct 打开了大模型在行为规划方面的思路;随后出现了 Tree-of-Thought, Graph-of-Thought, Forest-of-Thought 等各种个样的发展;这进而又推动了执行路径的优化,比如引入 MCMC (Monte-Carlo Markov Chain) 等技术等等。
2.Memory:传统 Agent 记忆往往依赖于事先定义的 schema,这限制了 Agent 记忆可用的状态空间和表达能力。GenAI 提供了统一的语义表征,Agent 记忆从而获得了近乎“free form”的能力,大大扩展了 Agent 记忆的应用范围。
3.多模态能力:基于预大模型的技术实质上创建了一个统一的语义空间,从而使得各种模态的数据能在这个统一的空间里进行训练,应用程序因而也能够对多种模态的数据进行统一的处理。
4.Self-reflection:Agent 在 LLM 的加持下,能够对自身的计划和执行结果进行进一步的分析,获得改进以进一步提高准确率等性能。
以上种种能力结合到一起,完善了一个通用 MAS 的场景。在 GenAI 的加持下,Agent 现在有了统一的语义表达方式来进行通信,同时也拥有了动态计划的生成能力,还能够通过反思对计划和结果进行反思。这实际上形成了某种递归的问题解决模式,而这正是智能的核心特征之一。(《GEB》)
随着简单的 LLM 封装在各种商业场景中逐步暴露出能力的局限,Agentic AI 继而在生成式 AI 这波浪潮后深入发展。在德勤发布的“How AI agents are reshaping the future of work”( https://www2.deloitte.com/content/dam/Deloitte/us/Documents/consulting/us-ai-institute-generative-ai-agents-multiagent-systems.pdf) 报告探讨了 Agentic AI 在复杂(和不可预测)场景中的明显优势。
作为 deeplearning.ai 的创始人,Andrew Ng 也在各种场合探讨 Agentic AI Workflow 的重要性(Andrew Ng Explores The Rise Of AI Agents And Agentic Reasoning | BUILD 2024 Keynote https://www.youtube.com/watch?v=KrRD7r7y7NY)。在他看来,Agentic AI 代表了新一代智能体技术的发展,其核心是通过分步骤规划、迭代式工作流和角色分工,使智能体能够以更高效和精准的方式解决问题。同时他也提出了当前 Agentic AI 中最核心的几种设计模式:
1.反思(Reflection)
2.工具使用(Tool Use/API Call)
3.计划(Planning)
4.多智能体(Multi-Agent Collaboration)
随着技术理解的进一步加深和实践中的优化和调整,Agentic AI 已经在各种场景中得到应用和发展,2025 年成为 AI Agent 元年 (Why 2025 Will Be The Year of AI Agents https://www.youtube.com/watch?v=kHPXbo2OkzA)。未来,Agentic AI 将从单一 Agent 发展到“群体协作”的模式,彼此协作甚至对抗,完成更复杂的任务。
作为 AI 时代 Data Infra 无人区的探索者,质变科技于近日发布了一项以数据为中心的 AI 分析服务 Relyt AI。依托于以大模型为基础的可解释分析引擎、端到端(E2E)的数据理解与管理技术,以及支持 PB 级大规模计算的核心技术,Relyt AI 能够提供包括基于数据集的 AI 问答、自然语言交互的数据分析、探索与洞察等一系列能力。这些功能广泛应用于对准确性要求极高的工作场景。
目前,Relyt AI 分析服务已经在全球市场获得了超过 110 万用户的高频使用和验证,累计处理超 200 万文件、1200 万数据任务。AI-ready Data Infra 正在持续迭代,质变科技期待与全球客户一起,激活每个人的数据潜能。
版权声明: 本文为 InfoQ 作者【AI数据云Relyt】的原创文章。
原文链接:【http://xie.infoq.cn/article/93ffd50498a07bc9c0b316ad4】。文章转载请联系作者。
评论