写点什么

DeepSeek 系列新模型正式上线昇腾社区

作者:Geek_2d6073
  • 2025-02-06
    湖北
  • 本文字数:629 字

    阅读完需:约 2 分钟

DeepSeek AI 最新发布的多模态大模型 Janus-Pro,以及之前发布的大型语言模型 DeepSeek-R1、DeepSeek-V3 及 DeepSeek-V2,一经发布,就在 AI 领域引起了热烈反响,多项创新技术显著提升了模型的性能与效率。DeepSeek 系列模型首发即支持昇腾平台,让用户能够在昇腾硬件和 MindIE 推理引擎上实现高效推理。

2025 年 2 月 4 日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro 正式上线昇腾社区,支持一键获取 DeepSeek 系列模型,支持昇腾硬件平台上开箱即用,推理快速部署,带来更快、更高效、更便捷的 AI 开发和应用体验,欢迎广大开发者体验使用。



下面以 Deepseek-V3 为例,演示在昇腾社区如何高效获取模型及使用

硬件要求:

部署 DeepSeek-V3 模型需配置 4 台 Atlas 800I A2(8*64G)服务器资源

模型调用实践:

一、权重转换

GPU:



NPU:



二、加载镜像

在昇腾社区/开发资源下载适配 DeepSeek-V3 的镜像包:

mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64

完成之后,请使用 docker images 命令确认查找具体镜像名称与标签。



三、容器启动

提供的 MindIE 镜像预置了 DeepSeek-V3 模型推理脚本,从您信任的来源自行获取权重后,放置在从上述下载的模型代码的主目录下,修改模型文件夹属组为 1001,执行权限为 750,启动容器。




四、服务化测试

配置服务化环境变量,expandable_segments-使能内存池扩展段功能,即虚拟内存特性



修改服务化参数



拉起服务化



出现“Daemon start success!”,则认为服务成功启动。

更深入了解 DeepSeek 系列模型在昇腾上的使用方法及指导文档,可登录昇腾社区模型库专区学习了解!

用户头像

Geek_2d6073

关注

还未添加个人签名 2021-12-22 加入

还未添加个人简介

评论

发布
暂无评论
DeepSeek系列新模型正式上线昇腾社区_Geek_2d6073_InfoQ写作社区