单个大模型的训练成本，两年后或涨至近百亿美元

作者：算AI

2024-04-29
天津
本文字数：547 字
阅读完需：约 2 分钟

美国 AI 公司 Anthropic 的 CEO 达里奥·阿莫迪（Dario Amodei）近日在接受《纽约时报》记者采访时，谈到了训练 AI 大模型的成本问题。Anthropic 公司以 Claude 系列大模型而闻名，近期推出的 Claude 3 Opus 在整体性能上已经超过了 GPT-4。

达里奥·阿莫迪指出，对于目前已经训练出来的高性能大模型，一个大模型的训练成本大约在一亿美元左右（正负会有两、三倍误差）；对于目前正在训练、今年晚些时候或者明年初推出的高性能大模型，一个大模型的训练成本大约在十亿美元左右，这是正在发生的事。达里奥·阿莫迪认为到了 2025—2026 年，有关的训练成本会接近五十亿或者一百亿美元。

上述的部分训练成本数值从近期斯坦福大学发布的《2024 年人工智能指数报告》[1]中可以得到一定程度的验证。这份报告中含有若干现有大模型的训练成本的估算，例如：