写点什么

OpenAI 的“噩梦”,DeepSeek V3-0324 效率革命展现中国 AI 雄心

  • 2025-03-25
    浙江
  • 本文字数:1037 字

    阅读完需:约 3 分钟

3 月 24 日晚,DeepSeek 低调发布其 V3 模型的小版本更新——DeepSeek V3-0324,这一操作立即在社区引发热议。据悉,该版本已集成至 DeepSeek 官网、应用程序和小程序,用户只需关闭“Deep Thinking”功能即可体验。另该模型已在 Hugging Face 上开源,采用 MIT 许可证,支持商业使用。

这一版本延续了 V3 系列的混合专家(MoE)架构,总参数在 671B 至 685B 之间(具体数字待官方验证),推理时仅激活 37B 参数。

技术亮点:效率与性能的双重突破

1. 惊艳的硬件适配与推理速度

据 VentureBeat 报道,V3-0324 在 Mac Studio(M3 Ultra,512GB RAM)上运行 4 位量化版本时,可达到 20 tokens/秒的推理速度,仅消耗 200 瓦功率。对比之下,OpenAI 的 GPT-4o 依赖 NVIDIA GPU 集群,功耗动辄数千瓦。这种本地运行能力得益于模型体积优化(未量化 641GB,量化后 352GB)和 FP8 混合精度训练,使其在消费级设备上也能高效运作。在 NVIDIA RTX 4090 上,INT8 量化版本可能接近 30-40 tokens/秒。

2. 代码生成能力逼近顶级模型

据用户反馈,V3-0324 在编程任务中表现卓越,能生成 700-800 行无错代码,甚至一次性构建完整网站。据社交媒体,其在 KCORES 大模型竞技场中以 328.3 分排名第三,仅次于 Claude-3.7-Sonnet-Thinking 和 Claude-3.5,超越 DeepSeek-R1。VentureBeat 则将其与 Claude 3.5 Sonnet 相提并论,推测这一进步源于从 R1 模型蒸馏的优化技术。

3. 多领域能力提升

  • 数学与推理:V3-0324 的知识截止日期更新至 2024 年 7 月(较 V3 的 2023 年 12 月更进一步),数学能力显著增强。虽非推理专属模型,其表现已接近部分闭源巨头。

  • 通用性:V3-0324 在前端设计(如生成海报)等创意任务中表现出色,显示出超越传统技术应用的潜力。


4. 核心技术驱动效率革命

V3-0324 依托多头潜在注意力(MLA)和多 token 预测(MTP)技术,支持 128K token 上下文窗口,生成效率较传统单 token 预测提升近 80%。MoE 架构确保其低计算成本,有媒体强调其训练费用仅 550-600 万美元,远低于 GPT-4 的数千万美元。竞争已不再是“谁能构建最强 AI”,而是“谁让更多人用上 AI”。

对行业的冲击:OpenAI 的“噩梦”?

有媒体分析,V3-0324 是“OpenAI 的噩梦”,原因有三:

  1. 成本颠覆:开源免费+低价 API 挑战了闭源模型的高收费模式。

  2. 本地化优势:20 tokens/秒的 Mac Studio 表现削弱了云服务的必要性。

  3. 性能竞争力:代码和数学能力逼近 GPT-4o 和 Claude 3.5,足以满足大多数需求。


V3-0324 在竞技场排名超越部分闭源模型,显示出开源 AI 的崛起潜力。若 R2 或 V4 突破推理和多模态,其影响力或超预期。当前,竞争已不再是“谁能构建最强 AI”,而是“谁让更多人用上 AI”。


发布于: 2 小时前阅读数: 9
用户头像

经百万用户验证的AI就绪数据基础设施提供商 2024-06-14 加入

以一份数据为基础,提供原生稳定、极致性价比、按需付费的交互式分析、实时分析以及ETL服务。助力传统数据平台升级为 AI-ready 数据平台,促进 AI 在企业严谨生产场景的落地,提高准确性、数据洞察力、决策效率。

评论

发布
暂无评论
OpenAI的“噩梦”,DeepSeek V3-0324效率革命展现中国AI雄心_openai_AI数据云Relyt_InfoQ写作社区