写点什么

Gemini 2.5 模型重大升级:更智能的 AI 技术

作者:qife
  • 2025-07-31
    福建
  • 本文字数:811 字

    阅读完需:约 3 分钟

Gemini 2.5:我们的最智能模型变得更强大

Gemini 2.5 Pro 持续受到开发者喜爱,成为最佳编程模型,而 2.5 Flash 通过新更新变得更出色。我们还在模型中引入了新功能,包括 Deep Think——2.5 Pro 的实验性增强推理模式。

2.5 Pro 性能表现

最新版 2.5 Pro 在 WebDev Arena 和 LMArena 排行榜上领先,成为世界顶级模型。凭借 100 万 token 的上下文窗口,2.5 Pro 拥有最先进的长上下文和视频理解能力。结合 LearnLM 教育模型家族后,2.5 Pro 也成为学习领域的领先模型。

Deep Think 模式

我们正在测试名为 Deep Think 的增强推理模式,该模式采用新技术让模型在回应前考虑多种假设。2.5 Pro Deep Think 在 2025 USAMO 数学竞赛基准测试中表现优异,在 LiveCodeBench 编程竞赛基准测试中领先,并在 MMMU 多模态推理测试中获得 84.0%的高分。

2.5 Flash 改进

2.5 Flash 是我们最高效的"工作马"模型,专为速度和低成本设计。新版在推理、多模态、代码和长上下文等关键基准测试中均有提升,同时效率提高 20-30%。

新 2.5 功能

原生音频输出和 Live API 改进

Live API 现在支持音频-视觉输入和原生音频输出对话,可构建更自然的对话体验。模型可以调整语调、口音和说话风格,并支持工具使用。

计算机使用能力

我们将 Project Mariner 的计算机使用能力引入 Gemini API 和 Vertex AI,多家公司正在探索其潜力。

更强的安全性

我们显著增强了对抗安全威胁的保护,如间接提示注入攻击,使 Gemini 2.5 成为迄今为止最安全的模型系列。

开发者体验

思维摘要

2.5 Pro 和 Flash 现在在 Gemini API 和 Vertex AI 中包含思维摘要功能,将模型的原始思维组织成清晰格式。

思维预算

我们将 2.5 Flash 的思维预算功能扩展到 2.5 Pro,让开发者能控制模型在回应前使用的 token 数量。

MCP 支持

我们在 Gemini API 中添加了对模型上下文协议(MCP)的原生 SDK 支持,便于与开源工具集成。


我们持续创新改进模型和开发者体验,同时加倍投入基础研究的广度和深度。更多更新即将到来。更多精彩内容 请关注我的个人公众号 公众号(办公 AI 智能小助手)公众号二维码


办公AI智能小助手


用户头像

qife

关注

还未添加个人签名 2021-05-19 加入

还未添加个人简介

评论

发布
暂无评论
Gemini 2.5模型重大升级:更智能的AI技术_深度学习_qife_InfoQ写作社区