写点什么

凌晨 GPT - 4.1 霸气登场,性能狂飙还降价

作者:GPU算力
  • 2025-04-15
    北京
  • 本文字数:796 字

    阅读完需:约 3 分钟

凌晨 GPT - 4.1霸气登场,性能狂飙还降价

昨夜今晨,OpenAI 给全球 AI 圈丢出了一颗震撼弹 ——GPT-4.1 系列横空出世,瞬间成为焦点!

1、三款新模型齐发

GPT-4.1 系列这次一口气推出 GPT-4.1、GPT-4.1 mini、GPT-4.1 nano 三款模型,开发者现在能通过 API 调用抢先体验。在关键性能上全面超越 GPT-4o 等。编程与指令遵循能力大幅跃升,更拥有高达 100 万个上下文 token 的超大容量,知识储备更新至 2024 年 6 月。OpenAI 官宣,2025 年 7 月 14 日将停用 GPT-4.5 预览版,给开发者留足过渡时间。



2、性能指标爆表

在权威的 SWE-bench Verified 编程测试中,GPT-4.1 成绩亮眼,以 54.6%的高分,比 GPT-4o 提升 21.4%,比 GPT-4.5 提升 26.6%,成为编程模型中的佼佼者。处理代码 diff 时,可靠性超强,在 Aider 多语言差异基准测试里,成绩远超 GPT-4o 和 GPT-4.5。输出 token 限制大幅增加,前端编程进步显著。



3、指令遵循稳如泰山

Scale 的 MultiChallenge 基准测试显示,GPT-4.1 得分达 38.3% ,比 GPT-4o 高出 10.5% 。对格式、负面指令、有序指令等指令遵循大幅提升。在 IFEval 测试中,GPT-4.1 以 87.4%的得分大幅领先 GPT-4o 的 81.0% ,极大保障了应用运行的稳定性和可靠性。



4、长上下文处理游刃有余

新模型在长上下文处理方面堪称“开挂”,能轻松应对 100 万个上下文 token,而 GPT-4o 仅能处理 12.8 万个。不管复杂信检索还是 OpenAI-MRCR、Graphwalks 高难度测试,GPT-4.1 都能精准应对,堪称处理大型代码库和海量长文档的“神器”。



5、视觉理解表现卓越

在图像理解领域,GPT-4.1 系列表现不俗,特别是 GPT-4.1 mini,在 MMMU、MathVista 等图像基准测试中多次击败 GPT-4o。处理长视频时,在 Video-MME 测试里,GPT-4.1 以 72.0%的高分超越 GPT-4o 的 65.3% 。



OpenAI 此次在提升性能同时还降低价格,即时缓存折扣从 50%大幅提升至 75%,长上下文请求无需额外收费。


OpenAI 原博客地址:https://openai.com/index/gpt-4-1/


原文链接:https://blog.csdn.net/LANHYGPU/article/details/147241185


#OpenAI #GPT - 4.1 #人工智能前沿 #科技新动态

用户头像

GPU算力

关注

GPU服务器.水冷工作站.液冷服务器 2021-11-25 加入

深度学习GPU液冷服务器,大数据一体机,图数据库一体机

评论

发布
暂无评论
凌晨 GPT - 4.1霸气登场,性能狂飙还降价_openai_GPU算力_InfoQ写作社区