828 华为云征文 - 基于 Flexus 云服务器 X 实例体验大模型部署体验测评

2024-12-23
海南
本文字数：1311 字
阅读完需：约 4 分钟

��大家好，我是雄雄

前言

当下，各种大模型层出不穷，先有 openai 的 chatgpt，后有百度文心一言，再就是国内大模型齐头并进的抢先发布。

让普通的开发者不必为不能体验 chatgpt 而担忧，国内的大模型速度也很快。但是大家目前都是在体验，能不能部署一下试试呢？

今天，我们就以华为云 Flexus 云服务器 X 实例来部署一下，顺便测测其性能看看。

在华为云 828 B2B 企业节狂潮中，Flexus X 实例的限时大促销震撼来袭，绝对是你不容错过的超级福利！对于那些追求极致算力、对自建 MySQL、Redis、Nginx 性能有着苛刻要求的技术极客们，这次活动无疑是你们的专属盛宴！赶紧抓住这个千载难逢的机会，让业务效能飞跃升级！！！

注意：本文为高端局，对于还不知道怎么使用 shell 工具，不知道云服务器为何物？不知道大模型为何物的读者可以退出啦，本文不太适合

部署千问大模型

之前一直就想搞个大模型玩玩了，奈何电脑配置不打够，所以只能是可望而不可及，今天，就单独用这款华为云 Flexus 云服务器 X 实例来试试。

本文我们基于 Ollama 部署和运行大模型，那么，何为 Ollama？

不过官网上都是洋文，看着比较吃力。我搜了些资料，给大家现个丑：

Ollama 是一个强大的框架，设计用于在 Docker 容器中部署 LLM。Ollama 的主要功能是在 Docker 容器内部署和管理 LLM 的促进者，它使该过程变得非常简单。它帮助用户快速在本地运行大模型，通过简单的安装指令，可以让用户执行一条命令就在本地运行开源大型语言模型，例如 Llama 2。

下面，我们来开始实操！