写点什么

MIAOYUN | 每周 AI 新鲜事儿(07.11-07.18)

作者:MIAOYUN
  • 2025-07-21
    四川
  • 本文字数:4098 字

    阅读完需:约 13 分钟

MIAOYUN | 每周AI新鲜事儿(07.11-07.18)

紧跟 AI 发展浪潮,洞察行业未来,MIAOYUN「每周 AI 新鲜事儿」,为您精选全球 AI 领域的最新动态,涵盖 AI 新模型发布、AI 产品及工具、技术突破、市场动态等,助您走在智能时代前沿,一起来回顾本周发生的 AI 新鲜事儿吧!


AI 开源模型


月之暗面发布并开源「Kimi K2」模型,擅长代码与 Agentic 任务


7 月 11 日,月之暗面发布并开源「Kimi K2」模型,是一款具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,总参数 1T,激活参数 32B。目前,「Kimi K2」已在 Hugging Face 上开放模型权重,并提供免费 API 接口,兼容 OpenAI 和 Anthropic 标准,支持最长 128K 上下文,在多个基准测试达开源模型 SOTA 成绩。


参考:Kimi K2 发布并开源,擅长代码与 Agentic 任务


智源研究院开源「RoboBrain 2.0」具身大脑模型和「RoboOS 2.0」框架


7 月 14 日,北京智源研究院发布具身大脑「RoboBrain 2.0」32B 版本以及跨本体大小脑协同框架 「RoboOS 2.0」单机版,全面开源模型权重、训练代码及评测基准。「RoboBrain 2.0」32B 版本凭借时空认知能力的突破,刷新空间理解和长链推理等 10 项评测基准。「RoboOS 2.0」作为全球首个具身智能 SaaS 开源框架,创新性集成 MCP 协议与无服务器架构,实现轻量化部署,打通智能大脑与异构本体协同通路,具身大脑与跨本体大小脑协同框架双擎联动,加速群体智能。


参考:智源全面开源RoboBrain 2.0与RoboOS 2.0:刷新10项评测基准,多机协作加速群体智能


腾讯混元上线「Hunyuan-A13B」模型 API 服务


7 月 14 日,腾讯混元团队宣布其最新大语言模型 「Hunyuan-80B-A13B」全面开源,模型 API 在腾讯云官网上线,输入价格为每百万 Tokens 0.5 元,输出价格为每百万 Tokens 2 元。作为首个 13B 级别的 MoE 开源混合推理模型,总参数达 80B,激活参数仅 13B,在多个权威数据测试集上表现优异,尤其在 Agent 工具调用与长文处理方面效果突出。支持 256K 原生上下文窗口,并引入融合推理模式,用户可根据任务需求切换快思考与慢思考模式,兼顾效率与准确性。


参考:腾讯混元Hunyuan-A13B技术报告:智能与效率“甜蜜点”的极致追求


Mistral AI 发布首个开源语音模型「Voxtral」系列


7 月 16 日,Google 和 Meta 前研究人员创立的 AI 初创公司 Mistral AI,最新发布了首个开源语音模型「Voxtral」系列,包含 24B 和 3B 两个参数规模的版本,均基于 Apache 2.0 许可证开源,同时提供 API 服务接口。「Voxtral」模型支持 32k token 的上下文窗口,能够处理长达 30 分钟的音频转录任务或 40 分钟的语义理解任务。「Voxtral」模型继承了 Mistral Small 3.1 基座模型的文本理解能力,除了基础的语音转文字功能外,还可以直接对音频内容进行问答交互,生成结构化摘要,并通过语音指令触发 API 调用。


参考:Mistral首个开源语音模型来了!全面碾压Whisper,多项测试超越GPT-4o mini


AI 工具


Google DeepMind 开源全新 Python 库「GenAI Processors」


7 月 11 日消息,Google DeepMind 最近开源了全新 Python 库「GenAI Processors」,旨在简化基于 Gemini API 的生成式 AI 应用开发。其核心是统一的“Processor”接口,可将复杂 AI 流程拆分为模块化单元,支持实时处理音频、视频和文本等多模态数据,并借助 Python 的 asyncio 机制优化并发执行,显著降低 I/O 密集型任务的延迟。


参考:谷歌 DeepMind 发布 GenAI Processors:一个轻量级 Python 库,支持高效并行内容处理


每日互动发布全新操作系统「GAI OS」及 AI 办公套件「GAI Office」


7 月 16 日,每日互动 CEO 方毅在“GAI·每日互动 AI 新品发布会”上发布全新操作系统「GAI OS」,以及面向垂直行业的 AI 办公套件「GAI Office」。方毅透露,公司目前正联合信通院研发属于中国开发者的 MCP 协议,在保障 App 数据主权的前提下,打造一个知识平权的、各类 App 聚合的立体生态「GAI Store」。并介绍公司的战略布局:「GAI OS」提升垂直模型可用性,「GAI Office」强化 AI 的实用性,「GAI Store」实现 AI 生态的可扩展性,构建起安全可控、场景深耕、生态共赢的 AI 基础设施。


参考:GAI·每日互动AI新品发布会:开启智能进化新纪元


Claude 推出「MCP 工具目录」,一键集成外部应用,简化 AI 工作流


7 月 17 日消息,Anthropic 旗下的 AI 助手 Claude 宣布新增「应用和工具目录」,通过直观的界面支持用户快速链接和启用 MCP(Model Context Protocol,模型上下文协议)服务,实现对 Asana、GitHub、Slack 等主流工具的一键集成,极大降低了 AI 与外部服务集成的技术门槛,推动 Claude 从单一对话工具向能够执行复杂任务的综合协作平台转型。


参考:体验 Claude 新上线的工具和应用目录:让 MCP 成为 AI 助手的“万能插座


AI Agent


MiniMax 稀宇科技正式发布「Agent 全栈开发功能」


7 月 16 日,MiniMax 稀宇科技正式发布「MiniMax Agent 全栈开发功能」,是全球首个在复杂全栈网站应用上高交付率的 Agent,可无代码一键构建完整应用系统,支持 Supabase 后端托管、Stripe 支付功能、cron job 定时任务、长链接维持等能力,可开发需要 API、实时数据、下单支付、LLM 调用、定时任务、登录注册等功能的各类应用。


参考:一句话聊出你的复杂网站应用,MiniMax Agent全栈开发能力“靠谱”上新


亚马逊云科技发布 Agent 全家桶,AI Agents 开启新纪元


7 月 17 日,在亚马逊云科技纽约峰会上,亚马逊云科技详解公司 Agentic AI 战略,连发五大 Agentic AI 开发利器,揭秘从基础设施、模型、Agent 框架到应用层的最新成果。会上,正式发布了「Amazon Bedrock AgentCore 预览版」,提供 7 大 AI Agents 核心服务(运行时、记忆、身份验证等),并推出「Amazon Nova 定制选项」和「Strands Agents V1.0」框架,使 Agents 开发更简单,实现多 Agents 协同工作。


参考:刚刚,亚马逊推Agent全家桶!5招连发,狂堆猛料,吹响AI集结号


OpenAI 发布「ChatGPT Agent」


7 月 18 日,OpenAI CEO Sam Altman 在新产品直播中,发布了全新的「ChatGPT Agent」。该 Agent 一个重要功能模块是其多工具集成能力,将 Operator 的网站交互能力、Deep Research 的信息整合能力以及 ChatGPT 的深度对话能力融合在一起,形成统一的智能体系统,支持自动生成 PPT、管理日程、购物及运行代码。


参考:刚刚,OpenAI通用智能体ChatGPT Agent正式登场


技术突破


「MCP」直接替代方案,「UTCP」协议推动 AI 工具调用的革新与发展


7 月 15 日,全球开发者推出了一种革命性 AI 工具调用标准「UTCP」(Universal Tool Calling Protocol,通用工具调用协议)。旨在让 AI 代理能够直接、快速地调用任何工具,无需依赖传统的代理服务器。与现有的 MCP 协议相比,「UTCP」的优势在于其能够让 AI 直接与工具的原生接口对接,包括 HTTP、gRPC、WebSocket 和 CLI 等多种方式,减少了调用过程中的延迟和复杂性,同时充分复用现有的身份验证、权限和计费机制。


参考:MCP 未兴,UTCP 又来


多智能体协作突破,昆仑万维发布分层多智能体协作框架「AgentOrchestra」


7 月 16 日,昆仑万维 Skywork 联合南洋理工大学,正式发布全新的分层多智能体协作框架「AgentOrchestra」, 以“交响乐团式协作”为核心,将复杂任务分解,由多个智能体分工协作完成。该框架由顶层“指挥”「Planning Agent」统筹,配合三类专业“乐手”智能体「Deep Researcher」、「Browser Use」、「Deep Analyzer」分工协作。这套框架在 SimpleQA、GAIA、HLE 等全球权威评测中表现优异。


参考:“AI交响乐团”横扫榜单,AgentOrchestra强势登顶智能体评测


Google DeepMind 推出全新「MoR」架构,推理速度翻倍、内存减半


7 月 17 日,Google DeepMind、KAIST、Mila 等机构发布了全新 LLM 模型架构「MoR」(Mixture-of-Recursions),推理速度提升 2 倍,训练 FLOP 减少,KV 缓存内存直接减半,全面碾压传统的 Transformer。「MoR」通过共享权重压缩参数量,通过动态路由减少冗余计算,通过智能缓存减少内存开销,兼顾了性能、效率和计算资源利用率,是递归 Transformer 架构的重要演进。


参考:Transformer终结者!谷歌DeepMind全新MoR架构问世,新一代魔王来了


AI 行业动态


CAMEL-AI 与 Google Gemini 官宣合作,实现数据可视化和自动化


7 月 12 日,CAMEL-AI 宣布与 Google Gemini 达成合作,其「OWL」与「Gemini 2.5 Pro」合作联动,实现数据可视化和自动化。「Gemini 2.5 Pro」凭借其卓越的推理、综合和创造能力,以及超长上下文窗口的处理能力,为数据分析提供了强大的支持。而 CAMEL-AI 的「OWL」系统则通过将复杂任务拆解为多个子任务,由不同技能的智能体协同工作,显著提升了任务执行效率。


参考:CAMEL-AI与Gemini正式官宣合作,用Gemini 2.5 Pro实现数据可视化和自动化


AI 算力竞赛白热化,Meta 规划建设 GW 级超算集群


7 月 15 日,Meta 首席执行官 Mark Zuckerberg 在社交平台 Threads 上表示,Meta 正加速推进人工智能基础设施建设,将投入数百亿美元建设多个吉瓦级(GW)超级计算机集群(如 2026 年将达 1GW 算力的「Prometheus」和 2027 年计划部署超 5GW 算力的「Hyperion」),以确保在 AGI 竞赛中拥有顶级算力。同时,Meta 的竞争对手也在加码算力投资,如 xAI 近期宣布其 Memphis 超级计算机集群(约 30 万块 GPU)功耗在 200-300 兆瓦,而微软与 OpenAI 合作的「Stargate」项目计划投资超 5000 亿美元建设 AI 数据中心。


参考:小扎自曝挖人秘诀:小团队我亲自带,豪掷数百亿建GW集群,大家不图天价薪酬只为“造神”


NVIDIA 恢复「H20」在中国的销售,并推出全新且完全兼容的 GPU


7 月 15 日,NVIDIA 创始人兼首席执行官黄仁勋宣布将恢复「H20」在中国的销售,这距离 4 月 15 日美国商务部限制英伟达对华出售「H20」,已三个月整。据透露,黄仁勋在与中国政府和业界官员会面,探讨 AI 将如何提高生产力和扩大机遇时,表示美国政府已向 NVIDIA 保证将授予许可证,并且 NVIDIA 希望尽快启动交付。最后,他还宣布推出一款全新且完全兼容的「NVIDIA RTX PRO GPU」,称该产品“是为智能工厂和物流打造数字孪生 AI 的理想选择”。


参考:NVIDIA CEO 黄仁勋在美国和中国推广 AI


阿里云联合中央电视台发布的《中国人工智能应用发展报告(2025)》


7 月 15 日,阿里云研究院和中央广播电视总台央视频、总台研究院、总台技术局联合撰写的《中国人工智能应用发展报告(2025)》正式发布。报告提出人工智能的“654”体系,即六大技术创新趋势、五新应用落地场景和产业智能化四力评估体系,通过全景式分析框架,展现 AI 的行业应用全景。


参考:正式发布!一文总览《中国人工智能应用发展报告(2025)》

用户头像

MIAOYUN

关注

MIAOYUN,助力企业一秒入云,一键智维! 2018-11-08 加入

成都元来云志科技有限公司,简称“MIAOYUN”,成立于2019年,总部位于成都,在西安和上海设有研发中心和营销中心。成立以来,MIAOYUN坚持创新自研,致力于帮助客户一站式解决云原生系统复杂管运问题。

评论

发布
暂无评论
MIAOYUN | 每周AI新鲜事儿(07.11-07.18)_云计算_MIAOYUN_InfoQ写作社区