零基础 5 分钟拥有自己的 DeepSeek-R1 满血版
![零基础5分钟拥有自己的DeepSeek-R1 满血版](https://static001.geekbang.org/infoq/c8/c8a8377637deb0235a544690fcfa5239.png)
一、引言
2025 年春节期间,Deepseek 不仅成为了科技领域的热门话题,更是席卷了大江南北,点燃了每个人心中对于前沿技术的追求热情。在这个快速变化的时代,每一个人都在寻找能够让自己脱颖而出的机会,而拥有一个自己的 DeepSeek 满血版,无疑是抓住这一机遇的关键所在。
可是并非所有人都具备开发这样一款尖端产品的能力。面对这样的挑战,很多人可能会感到困惑甚至焦虑。但请不要担忧,今天将为您介绍由阿里云提供的完美解决方案——即使您是零基础,也能轻松拥有属于自己的 DeepSeek-R1 满血版。
阿里云一直以来都是技术创新的推动者,致力于让尖端技术更加亲民化、易用化。通过阿里云精心打造的一站式服务平台,用户无需深入了解复杂的编程知识或拥有专业的技术背景,即可便捷地搭建并部署自己的 DeepSeek 应用。无论是企业还是个人,阿里云都提供了详尽的指南和支持,确保每一位用户都能够顺利实现自己的技术愿景。
此外,阿里云还为初学者准备了一系列的学习资源和工具包,帮助用户从零开始逐步掌握 DeepSeek 的核心概念和技术细节。借助这些资源,即便是技术新手也能够在短时间内快速上手,开启探索 DeepSeek 无限可能的大门。不论您的目标是提升个人竞争力,还是为企业开拓新的发展空间,阿里云的解决方案都将为您提供强有力的支持。
解决方案链接:https://www.aliyun.com/solution/tech-solution/deepseek-r1-for-platforms?utm_content=g_1000401616
二、方案介绍
2.1 方案简述
当前,DeepSeek 的在线使用需求迅猛增长,导致出现服务器资源紧张,响应延迟增加,经常会显示服务器繁忙,降低了用户体验。本方案推荐在云端部署您的专属 DeepSeek 模型,不仅部署门槛低、支持各类模型尺寸,并且可以做到自动弹性扩展,云产品功能唾手可得,加速企业创新。
2.2 多方式使用 DeepSeek 模型
基于百炼 API 调用满血版:适用于倾向 API 调用,无需部署和运维的用户。新用户享有免费 Token,开通即可调用 DeepSeek 满血版。
基于人工智能平台 PAI 部署:适用于需要一键部署,同时需要推理加速、支持并发的用户。部署难度低,最快 10 分钟,最低 0 元即可完成部署。
基于函数计算部署:适用于需要一键部署,不关注运维、按量付费的用户,部署难度低,最快 10 分钟,最低 0 元即可完成部署。
基于 GPU 云服务器部署:适用于对模型推理速度有高要求,具备运维能力的用户。部署难度中等,最快 30 分钟,最低 15 元即可完成部署。
2.3 方案优势
满血版 DeepSeek 开通即可调用:百炼提供了 DeepSeek 模型调用的 API,其中 DeepSeek-R1 与 DeepSeek-V3 分别有 100 万的免费 Token,另有多款开源 Qwen 及 Llama 蒸馏模型支持调用。
部署效率与易用性:无需复杂的环境配置和硬件搭建,简单几步,最快 10 分钟就能快速实现不同尺寸的 DeepSeek 模型部署和应用。
算力需求与成本优化:云端部署提供了弹性、充足的算力支持,同时相比本地部署需要购买和维护昂贵的 GPU 硬件,云端部署按需付费的模式可以显著降低硬件成本。
唾手可得的创新资源:支持快速迭代和优化,开发者可以利用云平台提供的工具和资源,快速进行模型训练、调优和更新,加速创新。
三、方案部署
3.1 基于百炼 API 调用满血版
通过百炼模型服务进行 DeepSeek 开源模型调用,可以根据实际需求选择其他参数规模的 DeepSeek 模型。
![](https://static001.geekbang.org/infoq/f9/f97cf5e99f9ea9080491aaec24a00264.png)
3.1.1 获取百炼 API-KEY
登录阿里云百炼大模型服务平台。鼠标悬停于页面右上角的 image 图标上,在下拉菜单中单击 API-KEY。
![](https://static001.geekbang.org/infoq/5d/5dc373a587da708841686d87285f3f7a.png)
获取自己的 API-KEY,没有的话可以进行创建。
![](https://static001.geekbang.org/infoq/f3/f342f836f74f03c27c9d4b04a9e5cfd8.png)
3.1.2 使用 Chatbox 客户端配置 百炼 API 进行对话
访问 Chatbox,下载并安装客户端
![](https://static001.geekbang.org/infoq/0c/0c5c974fddefbc3d171acd279235e79e.png)
![](https://static001.geekbang.org/infoq/6b/6b0303b7a992eb4ac49df89ed6648408.png)
点击配置弹出的看板中按照如下进行配置。模型添加自定义提供方。
![](https://static001.geekbang.org/infoq/79/79ab57324529c1fef817a0118ac382e8.png)
在输入框输入内容开始对话。
![](https://static001.geekbang.org/infoq/5a/5a2ad0a3cbacc3174a992a2eb9279a47.png)
3.2 基于人工智能平台 PAI 部署
方案以 DeepSeek-R1-Distill-Qwen-7B 为例进行演示,该版本是一个通过知识蒸馏技术从小型化模型中提取推理能力的高性能语言模型。它是基于 DeepSeek-R1 的推理能力,通过蒸馏技术将推理模式迁移到较小的 Qwen 模型上,从而在保持高效性能的同时降低了计算成本。
![](https://static001.geekbang.org/infoq/61/61789abb3e0c300c66deabbf1b630568.png)
3.2.1 部署 DeepSeek-R1 模型
登录PAI 控制台,首次登录需要开通服务,选择暂不绑定 OSS Bucket 至 PAI 默认工作空间,然后点击一键开通按钮。
![](https://static001.geekbang.org/infoq/7c/7c56c45125879a9769079d51fbd40643.png)
在工作空间页面的左侧导航栏选择 Model Gallery 。在搜索框中输入 DeepSeek-R1,在搜索结果中选择 DeepSeek-R1-Distill-Qwen-7B。
![](https://static001.geekbang.org/infoq/26/26bb2622ea85aad54c3bd48728b34d83.png)
点击 DeepSeek-R1-Distill-Qwen-7B 进入模型详情页,然后点击右上角部署按钮。
![](https://static001.geekbang.org/infoq/31/3183022acc72d3f0fecce9a5c6ae1b54.png)
在弹出的部署面板中,部署方式选择加速部署,加速方式选择 vLLM,资源规格选择推荐使用 GPU:ml.gu7i.c8m30.1-gu30
![](https://static001.geekbang.org/infoq/75/75a1b5faaeaf969cc64b9c01510b90aa.png)
![](https://static001.geekbang.org/infoq/03/03c6354ca5d0f4457a2ed4e19083055c.png)
5 分钟部署完成。
![](https://static001.geekbang.org/infoq/50/50aa36de5a8d72c17d064001edbeabbb.png)
单击查看调用信息,在弹出的看板中选择公网地址调用,复制保存访问地址和 Token 。
![](https://static001.geekbang.org/infoq/f1/f1b96ac581f807dae46b59e1eec24b66.png)
3.2.2 使用 Chatbox 客户端配置配置 vLLM API 进行对话
运行 Chatbox 并配置 vLLM API ,单击设置。
![](https://static001.geekbang.org/infoq/f1/f104b5f6c9ff2ca794abc5f2d7df90fd.png)
在输入框输入内容开始对话。
![](https://static001.geekbang.org/infoq/7b/7b904b6c139c87ae3066d9b68515051c.png)
3.2.3 PAI-EAS 管理模型服务
通过 PAI-EAS 可以全面管理模型服务,包括但不限于查看服务状态、在线调试服务、扩缩容实例,以及实时监控服务性能。
![](https://static001.geekbang.org/infoq/c4/c4c9c7e7ab695812e19ace440a75f82a.png)
3.2.4 删除资源
若后续不使用可以删除 1 个 PAI-EAS 模型服务。
![](https://static001.geekbang.org/infoq/1c/1cb896287b02dbe8365be3596d1237dd.png)
![](https://static001.geekbang.org/infoq/a6/a67ef419bb6e1ad0f6f095eeb3b98e83.png)
3.3 基于函数计算部署
将 DeepSeek-R1 开源模型部署到函数计算 FC 。通过云原生应用开发平台 CAP 部署 Ollama 和 Open WebUI 两个 FC 函数。Ollama 负责托管 lmstudio-community/DeepSeek-R1-Distill-Qwen-7B-GGUF 模型,它是基于 DeepSeek-R1 的推理能力,通过蒸馏技术将推理模式迁移到较小的 Qwen 模型上,从而在保持高效性能的同时降低了计算成本。Open WebUI 则为用户提供友好的交互界面。借助 CAP,用户可以快速便捷地部署模型,而无需担心底层资源管理和运维问题,从而专注于应用的创新和开发。
![](https://static001.geekbang.org/infoq/94/941b9e3f1822a39bc0ef9208e7eff9c2.png)
3.3.1 部署 DeepSeek-R1 模型
点击云原生应用开发平台 CAP 项目模板,这里参数选择默认配置,直接单击部署项目,最后在弹出面板中单击确认部署,部署预计等待 10~15 分钟。
![](https://static001.geekbang.org/infoq/c0/c01e2d4a429b105a39290c761ac7e468.png)
![](https://static001.geekbang.org/infoq/a9/a909e62e5e0a6bdd4456d055bd3fda9f.png)
部署时长 13 分钟。
![](https://static001.geekbang.org/infoq/a4/a48c6d2f362f46e239a8ec133a568963.png)
3.3.2 Web 对话体验
访问 open-webui 地址,打开应用。
![](https://static001.geekbang.org/infoq/24/24a2bc8d86d0136edb7cf6be741a5a21.png)
与模型进行对话,发生了报错。
![](https://static001.geekbang.org/infoq/3e/3e3379d28daedae7ffd95169c95cc512.png)
![](https://static001.geekbang.org/infoq/a5/a5f2c0b88300bac1c6b0c30a5d77f99d.png)
有时候找不到模型。
![](https://static001.geekbang.org/infoq/ff/ffe9e9c9bb05de765e3fe0e3ceeba4a8.png)
又报错了。
![](https://static001.geekbang.org/infoq/3f/3f6265a6590c315e6acedfa6d87b387c.png)
在 deepseek 模型处可以修改配置。
![](https://static001.geekbang.org/infoq/3f/3fa31204aa6011635c135ec375a752e4.png)
3.3.3 使用 Chatbox 客户端配置 Ollama API 进行对话
选择模型提供方 Ollama API,填写 API 域名(步骤 1 中获取的访问地址),下拉选择模型 cap-deepseek-r1:latest,最后单击保存。
![](https://static001.geekbang.org/infoq/c4/c481f1507d031595476c7a96a651d4e7.png)
进行对话。这里比 web UI 稳定很多。
![](https://static001.geekbang.org/infoq/3c/3c1ffc15d692a80addcc17bf01b3c86d.png)
3.3.4 删除资源
登录云原生应用开发平台 CAP 控制台,在左侧导航栏,选择项目,找到部署的目标项目,在操作列单击删除,然后根据页面提示删除项目。
![](https://static001.geekbang.org/infoq/c2/c29f11660d772d59038a7115d91a4840.png)
![](https://static001.geekbang.org/infoq/3e/3e7c579b13037856c01addc01a618237.png)
![](https://static001.geekbang.org/infoq/7f/7f0919ac7a687f9ffc2505ef32f39e7f.png)
3.4 基于 GPU 云服务器部署
将 DeepSeek-R1 开源模型部署到 GPU 云服务器。在 GPU 云服务器上安装与配置 Ollama 和 Open WebUI。
![](https://static001.geekbang.org/infoq/ca/ca7c0ec97092d4f589e815c3529c8429.png)
3.4.1 准备环境
创建专用网络。
![](https://static001.geekbang.org/infoq/18/184b741424c01dd7d70287736138f893.png)
![](https://static001.geekbang.org/infoq/4c/4ca3d161418436d379b953ab027d9dd0.png)
创建安全组。
![](https://static001.geekbang.org/infoq/fe/fe87a27221a32892b588b2f65396a5f3.png)
创建 GPU 云服务器。
![](https://static001.geekbang.org/infoq/9a/9a429eca669442b43f4c886573ec3bb7.png)
![](https://static001.geekbang.org/infoq/15/159cb61a9d1576d9d6c7c984cf4bd5cf.png)
![](https://static001.geekbang.org/infoq/72/722da11b60babfcda088690b75d47d94.png)
3.4.2 应用部署
登录到 GPU 服务器,GPU 驱动完成安装后将重启实例。
执行以下命令部署 Ollama 模型服务。
部署完成如下图
![](https://static001.geekbang.org/infoq/82/8260594f8fec598294deea5dac83ebe7.png)
执行以下命令拉取模型。
![](https://static001.geekbang.org/infoq/25/25166de478dc559afe6b7629e7fb6396.png)
执行以下命令,运行模型,运行成功后,在键盘上敲击两次回车键。
执行以下命令部署 Open WebUI 应用。
3.4.3 Web 对话体验
打开 WebUI 之后,选择模型,然后进行对话。
![](https://static001.geekbang.org/infoq/1a/1a5429c14171c01fe61051b243a56cb6.png)
也可以使用 Chatbox 客户端配置 Ollama API 进行对话。配置参数:
下拉选择模型提供方 Ollama API,填写 API 域名 http://ECS 公网 IP:11434, 下拉选择模型 deepseek-r1:7b,最后单击保存。
![](https://static001.geekbang.org/infoq/b9/b9e70fd896ccadb93aebcf2d14058938.png)
进行对话如下:
![](https://static001.geekbang.org/infoq/a0/a0e8b7070965fa2b9190a20735a81276.png)
3.4.4 清理资源
登录到对应的控制台,删除 VPC、安全组、释放 GPU 服务器。
四、体验反馈
通过以上对四种方式的部署体验反馈如下:
1、整体来说调用百炼 API 最简单方便,其次基于 PAI 进行部署,使用 GPU 服务器部署相对来说比较复杂下,但可以自行选择实例配置。
2、在使用函数计算部署的时,通过 WebUI 访问的时候有时候模型加载不出来。
![](https://static001.geekbang.org/infoq/e6/e679fcbf3bca77650b185376ddb94b62.png)
还会经常报错。
![](https://static001.geekbang.org/infoq/86/86dae5dccf4fdc77bb0bdc659f5a12eb.png)
配置使用 chatbox 客户端的话,对话就比较稳定。
3、对于我个人而言,我认为基于百炼 API 调用满血版是最适合我的 DeepSeek 使用方式。推荐理由如下:
易用性:通过 API 调用方式,无需关注模型的部署和运维问题,只需按照 API 文档进行调用即可。这大大降低了使用门槛,可以专注于业务逻辑本身。
成本效益:新用户享有免费 Token,初期无需承担额外的成本即可体验 DeepSeek 模型的功能。
灵活性:API 调用方式具有高度的灵活性,可以根据需要随时调整调用参数和请求频率,以满足不同的业务需求。
4、在实际部署时需要评估如何配置 GPU 服务器及网络带宽等,这个希望可以提供实际的数据依据来做参考。
5、在企业实际使用中会涉及到自有产品接入 deepseek,这种情况推荐什么样的解决方案在云端部署。
6、此外可以增加一些关于模型性能调优、错误处理以及 API 限流等方面的说明及案例验证。
版权声明: 本文为 InfoQ 作者【穿过生命散发芬芳】的原创文章。
原文链接:【http://xie.infoq.cn/article/1bed38ea49fc9b1595c636227】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论