OpenAI 发布了 “轻量化” GPT-4o mini 功能更强、成本更低
美东时间 7 月 18 日(周四),OpenAI 正式推出新一代入门级别人工智能模型“GPT-4o mini”,称这款新模型是“功能最强、性价比最高的小参数模型”,旨在服务更广泛的客户群体。这也意味着开发人员如今有了一种轻量级且廉价的工具,让他们能够以更低的成本构建 AI 应用程序。
外媒报道中称,目前,GPT-4o mini 模型的应用程序编程接口支持文本和视觉,未来将支持文本、图像、视频和音频的输入和输出。
更重要的是,最新的“GPT-4o mini”比 GPT-4o 便宜了 96%~97%,比起 GPT-3.5 Turbo 也要便宜 60%~70%。正因如此,随着 GPT-4o mini 上架,GPT-3.5 Turbo 的历史使命到此结束。OpenAI 还表示,GPT-4o mini 是首个使用其全新安全策略“指令层级”的 AI 模型。
对于为何未能更早推出“小而精”的 AI 模型,OpenAI 的 API 产品负责人 Olivier Godement 表示,这纯粹是“优先级”的问题,而随着时间的推移,OpenAI 注意到开发人员越来越渴望使用较小的模型,这也让公司决定投入资源开发 GPT-4o mini。
GPT-4o mini:比 GPT-4o 便宜 96%将取代 GPT-3.5 Turbo
据 OpenAI,GPT-4o mini 的 API 价格将会是 15 美分/100 万 Tokens 输入,以及 60 美分/100 万 Tokens 输出。上下文窗口依然是 12.8 万个 Tokens,知识截止日期为 2023 年 10 月。公司拒绝透露新模型的参数量大小,仅表示与市面上类似的 AI 小模型(Claude Haiku、 Gemini 1.5 Flash 等)处于同一个级别。
作为对比,GPT-4o 的百万 Tokens 输入和输出价格分别是 5$和 15$,之前的入门款模型 GPT-3.5 Turbo 定价分别是 0.5$和 1.5$。这就是说,最新的“迷你模型”的价格比 GPT-4o 便宜了 96%~97%,比起 GPT-3.5 Turbo 也要便宜 60%~70%。正因如此,随着 GPT-4o mini 上架,GPT-3.5 Turbo 的历史使命到此结束。
根据 Artificial Analysis 的统计,GPT-4o mini 已经达到美国 AI 公司主流“小模型”里面价格最低的位置,比起 Anthropic、谷歌的同类型竞品都要便宜一截。
OpenAI 称,最新的 GPT-4o mini 从周四起向 ChatGPT 的免费用户以及 ChatGPT Plus 和 ChatGPT Team 的订阅用户开放,并将在下周向 ChatGPT Enterprise 用户开放。GPT-4o mini 将取代 ChatGPT 中的旧模型 GPT-3.5 Turbo。
OpenAI 表示,GPT-4o mini 目前在聊天偏好上表现优于 GPT-4,在大规模多任务语言理解测试(MMLU)中的得分为 82%。(注:MMLU 是一个文本智能和推理基准,用于评估语言模型的能力。MMLU 分数越高,表明该模型可以更好地理解和使用各种领域的语言,从而增强现实世界的应用。)
图片来源:OpenAI 官网截图
而在这项测试中,同为小参数模型的谷歌 Gemini Flash 得分为 77.9%,Claude Haiku 得分为 73.8%。在更大参数的模型中,GPT-3.5 在这项测试中的得分为 70%,GPT-4o 得分为 88.7%,谷歌 Gemini Ultra 据称取得了有史以来最高分(90%)。
值得注意的是,研究人员对像 MMLU 这样的基准测试持谨慎态度,因为不同公司的管理方式略有不同,因此不同模型的得分难以比较。还有一个问题是,模型的数据库中可能有这些答案,也就是说其可以作弊,而且通常没有第三方评估人员参与这个过程。
入局小模型的背后
外媒报道中称,GPT-4o mini 的推出也是 OpenAI 推动“多模态”(multimodality)技术发展努力的一部分,多模态指的是在一个大模型中提供多种类型的 AI 生成媒体,如文本、图像、音频和视频。
不仅如此,这一全新小模型也承载着帮助 OpenAI 走入更广泛的客户群体的希望。OpenAI 在今年早些时候的最新一轮融资过后,估值已经超过 800 以美元。虽然是全球生成式 AI 估值最高的独角兽,但 OpenAI 仍面临着压力:一方面要保持其在生成式 AI 市场的领先地位,另一方面,由于其在 AI 基础设施上投入了大量资金以构建和训练模型,因此还要想方设法盈利。
图片来源:OpenAI 官网截图
GPT-4o mini 为开发人员提供一种轻量级且廉价的工具,让他们能够开发出所有的应用程序和工具,相对而言,GPT-4 这种更大、更昂贵的模型是他们无法负担得起的。此前,许多开发人员会转向 Claude 3 Haiku 或 Gemini 1.5 Flash,而不是支付运行最强大的模型所需的高昂计算成本。
而且,GPT-4o mini 是首个使用 OpenAI 全新安全策略“指令层级”的 AI 模型。这种方法的目的是使 AI 系统优先处理某些指令——例如来自公司的指令——以使人们更难让工具做不该做的事情。
OpenAI 的 API 产品负责人 Olivier Godement 在接受媒体采访时解释了为何该公司未能更早推出“小而精”的 AI 模型,他说,这纯粹是“优先级”的问题,因为 OpenAI 专注于创建更大、更好的模型,如 GPT-4,这需要大量的人力和计算资源。随着时间的推移,OpenAI 注意到开发人员越来越渴望使用较小的模型,因此公司决定现在是投入资源开发 GPT-4o mini 的时机。
“我们的使命是使最前沿技术、构建最强大、最有用的应用程序,我们当然希望继续做前沿模型,推动技术进步,”OpenAI 的 API 产品负责人 Olivier Godement 在接受媒体采访时说。“但我们也希望拥有最好的小模型,我认为它会非常受欢迎。”
“我认为 GPT-4o mini 真正体现了 OpenAI 让 AI 更加普及的使命。如果我们希望 AI 惠及世界的每一个角落,每一个行业,每一个应用,我们必须让 AI 更加实惠。”Godement 说道。
目前,金融科技初创公司 Ramp 已经使用 GPT-4o mini 构建了一个工具,可以提取收据上的费用数据。用户无须费力地浏览文本框,只需上传一张收据的图片,该模型就会进行分类。
电子邮件客户端 Superhuman 也对 GPT-4o mini 进行了测试,并用它创建了一个自动建议邮件回复的功能。
评论