写点什么

大模型是否有必要本地化部署?

  • 2025-04-05
    吉林
  • 本文字数:2062 字

    阅读完需:约 7 分钟

大模型是否有必要本地化部署?

一、大模型本地化部署

前段时间,有位朋友询问 DeepSeek 本地化部署是否有必要。这个问题看似简单,实际上并不好回答。个人认为,如果对数据安全有很强的要求,那么是需要的;再有就是对准确率要求非常高,需要对模型进行微调,在数据不能流出的情况下必须私有化部署。 如果对数据安全要求没有特殊要求,那么还是建议不要私有化部署,而是使用公有云的大模型服务。

当然,这并不是准确的回答,只能看做朋友间闲聊的一个讨论。任何一种方案的选择,都需要了解背景和需求,以及技术、安全等方面的限制,然后才能给出合理的方案。本篇就针对这一问题展开探讨。



二、大模型能力使用方式

目前主流的厂商(阿里的通义千问、百度文心一言、DeepSeek),对外提供大模型能力的方式包括以下几种:

1、网页版:

大家都比较熟悉,通过网页直接与大模型对话,支持上传附件、连网搜索等,随着 DeepSeek 的火爆,现在各大模型网页版也都加上了深度思考的选项。

2、API 接口调用(常用)

通过 API 接入的方式调用大模型能力。最常使用的就是对话接口,不同大模型至少都会提供这个接口(废话,要不然咋用),支持非流式和流式输出,以及是否开启联网搜索的选项。有些大模型(例如通义千问)还会提供 embedding(文本向量化)、图片生成等能力。

3、企业专属大模型训练

除了直接调用公版大模型外,企业还可以结合自身的行业知识和应用场景,来训练自己的企业大模型。大模型厂商会为企业提供专属数据空间,能够上传 PPT、PDF、图片、企业数据库等形式的数据,通过模型训练、微调(SFT 较多)训练出更适合自身领域的大模型;并且可以采购资源单独部署,规避公版大模型是所有人共用导致的服务不稳定(例如 deepseek,前段时间被攻击导致经常不可用),也可以获取更高的 qps 支持,当然成本也会很高。

4、开源大模型私有化部署

很多大模型厂商都提供了开源模型,例如 DeepSeek R1 和 V3,如果手头有足够的 GPU 资源,那么也可以自己部署到服务器上,更深度地体验和使用模型。

三 各方案适用场景

1、网页版

对普通用户来说是最方便的,可以快速体验和使用。但同时,这种方式无法通过程序调用,所以通常只作为体验、模型试用(效果摸底)、或日常零星使用,无法用于应用开发。

2、大模型(公版)的 API 调用

这是应用开发时最常用的使用方式。只要获取到调用所需的 API Key 并具备调用额度(大多是按 token 计费,会提供一些免费额度,也可以申请代金券或充值),阅读 API 文档,就可以根据示例进行代码调用。调用方式上,Python/Node.Js/Java/Curl 几种方式,不同产品稍有不同。如果你是 Java 开发,可以考虑使用 RestTemplate 通过 Get/Post 请求方式调用,无需引入 SDK。毕竟如果同时使用多个大模型时,引入一堆 SDK 也是不小的工作量,而且切换时也要复杂一些。

3、专属大模型:

从归属上为企业提供一个独立的模型,模型服务的位置还在互联网上,所以调用方式上基本一致(一般只有调用时使用的域名不同)。但毕竟是专属的,所以稳定性、安全性要好于公版,在一定程度上抵御大模型“投毒”带来的危害。

4、私有化部署:

如果有足够的人力、服务器、时间,就可以采购服务器进行私有化部署,构建集群,自行训练、微调,甚至升级模型,来为自己提高服务。当然成本也是几种方式中最高的。以 DeepSeek R1 满血版(671B)为例,资源需求如下:

CPU:至少 32 核以上,推荐服务器级处理器。

内存:至少 1TB DDR4 RAM。

硬盘:至少 500GB SSD 用于操作系统和模型文件。

显卡:8 张 A100/H100 GPU,每张显存至少 80GB。

70B 模型资源需求如下:

CPU:32 核以上

内存:128GB+

硬盘:70GB+

显卡:需多卡并行,如 2x A100 80GB 或 4x RTX 4090

英伟达 A100 显卡的价格区间较大,目前搜到的英伟达 GPU 显卡 A100-40G (定制版 PCIE)NVIDIA Tesla A100 40G,最低价格 4.5 万,有些渠道在 12 万元至 15 万元之间。即使是 70B 模型,整体部署成本也达到几十万人民币,满血版甚至可能百万级别。私有化部署的成本之高可见一斑。

四 为什么不推荐私有化部署?

能够私有化部署大模型,无疑是使用大模型最理想的方式。但也必须明确,目标是什么。是搭建一个自己玩玩、或用来给领导汇报、用来展示业绩(吹牛)的玩具?还是要在实际的场景中应用?二者有着天壤之别。如果只是玩具/政绩工程,那么部署一个 14B 模型,能跑起来一些 demo 就足够了,毕竟不需要考虑企业级应用的各种技术问题。

如果确定要做企业级应用,那么就必须参考以下问题:

1、成本

2、模型更新

模型私有化部署,意味着无法与公版大模型保持一致,不会同步更新。如果要更新需要手工执行。但就像开源代码拉下来并进行了定制化开发的分支,想要跟随更新的节奏非常困难。

3、知识、人才储备

无论是模型原理、微调、重新训练、还是 1 提到的算力管理、运维,都需要相当的技术门槛,从零开始的难度很大。

所以综上所述,除非有极强的科研或数据安全需求,否则不推荐私有化部署大模型。即使是数据安全有较强要求的场景,也推荐与厂商合作,给出专属解决方案,而不要头脑一热在没有足够支持的前提下就私有化部署,否则极有可能达不到预期的结果。

发布于: 刚刚阅读数: 6
用户头像

磨炼中成长,痛苦中前行 2017-10-22 加入

微信公众号【程序员架构进阶】。多年项目实践,架构设计经验。曲折中向前,分享经验和教训

评论

发布
暂无评论
大模型是否有必要本地化部署?_#架构_程序员架构进阶_InfoQ写作社区