写点什么

谷歌最强大模型 Gemini 3 炸场

作者:GPU算力
  • 2025-11-19
    北京
  • 本文字数:625 字

    阅读完需:约 2 分钟

谷歌最强大模型 Gemini 3 炸场

当地时间 11 月 18 日,谷歌发布迄今最强 AI 模型 Gemini 3,CEO 皮查伊称其“最智能”。发布即深度接入谷歌搜索的“闪电落地”速度, AI 竞赛从实验室跑分转向商业化实战。其 3 大核心优势:


1. 博士级推理与多模态能力双冠

Gemini 3 Pro 在 LMArena 以 1501 Elo 登顶,人类最后考试(HLE)裸考 37.5%,GPQA Diamond 测试 91.9%,拓扑学难题可自动给出三种解法。多模态领域 Video-MMMU 测试 87.6%,处理 720p 视频延迟不足 300 毫秒,能将手写食谱、论文转化为交互式材料。


2. 编程与智能体效率革新

WebDev Arena 以 1487 Elo 夺冠,SWE-bench Verified 测试 76.2%,响应速度较 GPT-5 快 40%,可生成 3D 游戏等复杂应用。搭配 Antigravity 平台,能自主完成邮件整理等任务,72 小时决策一致性达 95%,解决“任务漂移”问题。


3. 大语境与商业化落地能力升级

100 万 token 上下文窗口可处理 300 页书籍或 1 小时视频,量子计算问题零样本回答质量超 80%人类专家。医疗、法律等 12 项测试中 9 项领先竞品 15 个百分点,6.5 亿月活应用及 20 亿用户的 AI Overviews 已完成更新。

安全性能同步提升,经谷歌 AI 史上最全面评估,防注入、抗攻击表现更优。高阶 Deep Think 模式 HLE 得分 41%,GPQA Diamond 达 93.8%,进一步强化复杂问题解决能力。


GPT-5 强化版已在测试。Gemini 3 以“推理+效率+落地”优势指明方向:胜负关键在实际价值。对比竞品,其 37.5%的 HLE 得分远超 GPT-5.1 的 26.5%,95%的裸考准确率高于 Claude 4.5 的 87%,仅软件工程测试略逊于 Claude 的 77.2%。


#谷歌 Gemini3 #AI 新模型 #多模态 AI#AI 编程 #大语言模型 #科技热点

 

用户头像

GPU算力

关注

GPU服务器.水冷工作站.液冷服务器 2021-11-25 加入

深度学习GPU液冷服务器,大数据一体机,图数据库一体机

评论

发布
暂无评论
谷歌最强大模型 Gemini 3 炸场_大模型_GPU算力_InfoQ写作社区