写点什么

编程简单了,部署依旧很难|Karpathy 演讲的 5 点解读

  • 2025-06-24
    浙江
  • 本文字数:1170 字

    阅读完需:约 4 分钟

作者:望宸


看完了 Andrej Karpathy 在 YC AI Startup School 近 40 分钟的分享,有点意犹未尽。推荐观看完整视频(链接贴在文末阅读原文),没有任何模型架构,也没有任何算法细节,适合 AI 领域的所有从业者,包括 Agent Builder 和 Agent User。我们将一些核心观点进行了延展,并尝试用更易于理解的方式进行表达。

Software


软件 1.0 是“人写代码,机器照做”。我们用 if/else 来定义代码逻辑,告诉计算机每一步怎么干,就像在教一个听话但不会思考的助理。


软件 2.0 是“人给样本,机器自己学”。我们喂数据训练模型,让它自己学怎么做,再对输出进行调试,虽然过程有点黑箱,但效果不错,就像一个模仿能力很强的学徒。


软件 3.0 是“人说目标,机器理解并执行”。我们用自然语言告诉 AI 要做什么,它自己决定怎么做,就像在指挥一个聪明但偶尔出错的助手,我们不用再写具体的代码,而是在“发指令”。

LLM

认同 LLM 是一种新的电力,有基础公共设施的属性。


LLM 不只是建造一个发电厂,像投资晶圆场那样,还需要投入大规模的资金和高精尖人力。


更恰当的比喻是 LLM 是操作系统,并且是一个越来越复杂的软件生态系统,这不仅是大模型自身的多样性所决定的,也受到上下游的开发和部署工具的影响。

Agent


“滑动自治 Autonomy Slider”是获得 Agent 最大输出效果的必备产品工程,通过多轮的提示词和验证等机制,将 LLM 的自治能力纳入可控轨道,而不是让 Agent 完全自主。就像自动驾驶的分级(L1~L5),Agent 允许人在关键时刻“接管方向盘”。


把 Agent 拴在链子上,不要给 Agent 发大而泛的提示词,应是小而具体,输出要有验收逻辑。这不是在弱化 AI,而是在提升其产品稳定性,把 Agent 的行为纳入产品级约束框架中。例如,你提问“教我物理”,这会让 Agent 在森林里迷路,你也无法得到你想要的答案。


不要再尝试回答什么时候实现 AGI,而是提升产品工程和技术工程的质量(关于工程质量,推荐阅读这篇),让用户更易于去使用滑动自治。

Programming


Vibe Coding 一词首次出现是在 Karpathy 今年 2 月的推文中。他认为,对 AI 工程从业者来说,不再需要在某个领域深造 3-5 年才具备相应的领域编程能力,具备提示设计 + 工具组合 + Agent 协调 + 系统验证的人,会成为新的关键角色,从 if/else 的工程实现走向自然语言引导。

Engineering

编程越来越简单,但是部署依旧很难,例如要考虑身份安全、访问认证、支付验证等可用性问题,规模级的应用还要准备好可观测等稳定性相关的措施,这些不只是通过代码就能解决的,还依赖上下游的基础设施以及架构设计能力。


传统的基础设施是为人类设计的应用服务的,AI Infra 则应该是为 AI 设计的应用服务。Programning 是用户命令 LLM 做什么,但当前,Engineering 是各个 Vendor 的文档命令用户做什么,这是很大的区别。(🤔:这也许是 AI Infra Builder 们的机会?)


点击此处,立即观看!

发布于: 刚刚阅读数: 4
用户头像

阿里云云原生 2019-05-21 加入

还未添加个人简介

评论

发布
暂无评论
编程简单了,部署依旧很难|Karpathy 演讲的 5 点解读_阿里云_阿里巴巴云原生_InfoQ写作社区