写点什么

上海交大师生畅用满血 DeepSeek!昇腾加速中国自主创新大模型

作者:Geek_2d6073
  • 2025-02-18
    湖北
  • 本文字数:714 字

    阅读完需:约 2 分钟

近日,上海交通大学基于昇腾 Atlas 800T A2 算力集群,成功完成 DeepSeek 全系列模型的本地化部署,成为国内首个实现千亿级大模型全栈国产化部署的高校。此次部署涵盖 DeepSeek-R1、DeepSeek-V3 等核心模型,重点服务于教学、科研、管理和服务等多场景,标志着高校 AI 基础设施建设迈入新阶段。

这背后,是昇腾先进架构带来的卓越性能以及原厂服务 FAE 的支持,为多个 DeepSeek 模型提供算力支撑。针对高校场景的特殊需求打造三大技术突破:

轻量化推理架构:通过昇腾 Ascend 核间通信优化技术,实现 4 台 Atlas 800 服务器承载 DeepSeek-R1 和 DeepSeek-V3 千亿参数推理,硬件投入成本降低 65%;

动态资源调度:基于昇腾 AI 原生算力平台,实现教学、科研、管理和服务等各类场景的算力弹性分配,算力资源利用率实现一定程度的提升;

全栈自主可控:从昇腾处理器到 MindSpore 框架的深度适配,使 DeepSeek-V3 在复杂数学推理任务中的端到端时延较传统方案实现有效缩短。

借助华为昇腾的独特优势,DeepSeek 在推理效率上得到显著提升,成本也大幅降低。2025 年 2 月 4 日,DeepSeek-V3、DeepSeek-R1、Janus-Pro 正式上线华为昇腾社区,支持一键获取 DeepSeek 系列模型。

从即日起,上海交大师生可通过网页/APP 申请体验“满血版”DeepSeek,无需担心“深度思考用不了”“对话提问无反应”。同时,上海交通大学鲲鹏昇腾科教创新卓越中心也将推动 DeepSeek 系列模型与课程设计、科研创新等方面融合,探索 AI 加持下的学习与科研新范式。

鲲鹏昇腾科教创新卓越中心定位为基于鲲鹏昇腾技术路线的校级生态合作平台,在校企合作、产教融合方面发挥重要作用,卓越中心将持续推动 DeepSeek 等重要 AI 创新在高校领域落地,进一步将人工智能技术带到师生生活、学习、科研的方方面面,逐浪世界科技最前沿。

用户头像

Geek_2d6073

关注

还未添加个人签名 2021-12-22 加入

还未添加个人简介

评论

发布
暂无评论
上海交大师生畅用满血DeepSeek!昇腾加速中国自主创新大模型_Geek_2d6073_InfoQ写作社区