DeepSeek 快速体验,魔搭 + 函数计算一键部署模型上云
DeepSeek 模型近期在全网引发了广泛关注,热度持续攀升。其开源模型 DeepSeek-V3 和 DeepSeek-R1 在多个基准测试中表现优异,在数学、代码和自然语言推理任务上,性能与 OpenAI 的顶尖模型相当。对于期待第一时间在本地进行使用的用户来说,尽管 DeepSeek 提供了从 1.5B 到 70B 参数的多尺寸蒸馏模型,但本地部署仍需要一定的技术门槛。对于资源有限的用户进一步使用仍有难点。
为了让更多开发者第一时间体验 DeepSeek 模型的魅力,Modelscope 社区 DeepSeek-R1-Distill-Qwen 模型现已支持一键部署(SwingDeploy)上函数计算 FC 服务,欢迎开发者立即体验。
魔搭+函数计算,一键部署模型上云
SwingDeploy 是魔搭社区推出的模型一键部署服务,支持将魔搭上的各种(包括语音,视频,NLP 等不同领域)模型直接部署到用户指定的云资源上,比如函数计算 FC(以下简称 FC)GPU 算力实例。本文介绍如何通过魔搭 SwingDeploy 服务,快速将 DeepSeek 模型部署到阿里云函数计算 FC 平台的闲置 GPU 实例,并对部署后的模型进行推理访问。
函数计算平台提供了低成本的闲置 GPU 实例,使用闲置 GPU 实例,将带来如下优势:
实例快速唤醒:函数计算平台会根据您的实时负载水平,自动将 GPU 实例进行冻结。冻结的实例接受请求前,平台会自动将其唤醒。要注意,唤醒过程会存在 2-5 秒的延迟。
兼顾服务质量与服务成本:闲置 GPU 实例的计费周期不同于按量 GPU 实例,闲置 GPU 实例会在实例闲置与活跃期间以不同的单价进行计费,从而大幅降低用户使用 GPU 成本。相较于长期自建 GPU 集群,闲置 GPU 实例根据 GPU 繁忙程度提供降本幅度高达 80%以上。
魔搭社区一键部署介绍:https://modelscope.cn/docs/model-service/deployment/intro函数计算闲置 GPU 介绍:https://help.aliyun.com/zh/functioncompute/fc-3-0/user-guide/real-time-inference-scenarios-1
DeepSeek 模型介绍
性能对齐 OpenAI-o1 正式版
DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
data:image/s3,"s3://crabby-images/0edc5/0edc59d70546409a6834f3e38d2a0d820adf887a" alt=""
在此,DeepSeek 将 DeepSeek-R1 训练技术全部公开,以期促进技术社区的充分交流与创新协作。
论文链接:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
模型链接:https://modelscope.cn/collections/DeepSeek-R1-c8e86ac66ed943
蒸馏小模型超越 OpenAI o1-mini
DeepSeek 在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 7B 和 14B 模型在多项能力上实现了对标 OpenAI o1-mini 效果、展现了较高的生产环境部署性价比。
data:image/s3,"s3://crabby-images/a5de0/a5de0758c1cb80ad60298b144abfd22a23693b04" alt=""
立即体验
函数计算提供有 Ada 系列 48GB 显存的 GPU,供 DeepSeek-R1-Distill-Qwen 如下参数版本的模型运行。
data:image/s3,"s3://crabby-images/b0ede/b0ede58db5815e9287b5366bc5998368ec73b3b5" alt=""
本文将继续以 DeepSeek-R1-Distill-Qwen-7B 展现部署步骤,相同的部署步骤可应用于 1.5B、14B、32B 参数量模型的部署。
前置准备
账号绑定与授权:https://modelscope.cn/docs/model-service/deployment/swingdeploy-pipeline
进入 DeepSeek-R1-Distill-Qwen-7B 模型页:https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
开始部署
请选择 GGUF 格式的量化版本:
data:image/s3,"s3://crabby-images/01197/01197c51f627804d6f51b48802a1583978c43d23" alt=""
data:image/s3,"s3://crabby-images/c7e5a/c7e5a8a53a2b76f3373b8d3135d7cad5b134867f" alt=""
进入 DeepSeek-R1-Distill-7B-GGUF 模型页后,点击部署,部署类型选择付费的 FC GPU 算力。
data:image/s3,"s3://crabby-images/b3a71/b3a71ea51eee88eb40b979bf7501f5f6743adf5d" alt=""
data:image/s3,"s3://crabby-images/ad7c1/ad7c16cc09ad11b144004316a2af0b4aa6872058" alt=""
data:image/s3,"s3://crabby-images/9be04/9be04178898e241b3d83dd52cff5e5766b64b7ff" alt=""
部署地域:可选择杭州或上海。
GPU 卡型:默认将 DeepSeek 模型部署至 Ada 系列 48GB 显存 GPU,并开启闲置 GPU 模式,以降低您的运行成本。
查看部署过程,确认部署成功。
data:image/s3,"s3://crabby-images/294ff/294ffa50b7479701efd70dd08c822dfb97cd8e1f" alt=""
data:image/s3,"s3://crabby-images/fc743/fc743973d8a3f46aee313f9d58768cc925ada531" alt=""
确认状态为部署成功(预留模式),如果不是,请点击服务模式切换。
模型调用:
查看调用代码示例:
data:image/s3,"s3://crabby-images/d9f6b/d9f6b39f6f69c1e01c0f05cb10e71e01d26f5ce3" alt=""
调用模型,进行推理:
data:image/s3,"s3://crabby-images/7f249/7f249282f15c4ac1725eaedd4d31b6c0a98ce9c9" alt=""
首次调用由于模型加载导致耗时长,后续均为热调用无此问题。
进一步了解函数计算 GPU
FC GPU 实例介绍规格和使用模式介绍:https://help.aliyun.com/zh/functioncompute/fc-3-0/product-overview/instance-types-and-usage-modes
FC GPU 实时推理场景(闲置 GPU 模式)介绍:https://help.aliyun.com/zh/functioncompute/fc-3-0/use-cases/real-time-inference-scenarios-1
FC GPU 准实时推理场景(按量 GPU 模式)介绍:https://help.aliyun.com/zh/functioncompute/fc-3-0/use-cases/quasi-real-time-inference-scenarios
FC GPU 异步推理场景介绍:https://help.aliyun.com/zh/functioncompute/fc-3-0/use-cases/offline-asynchronous-task-scenario
FC GPU 镜像说明:https://help.aliyun.com/zh/functioncompute/fc-3-0/use-cases/image-usage-notes-1
FC GPU 模型存储最佳实践:https://help.aliyun.com/zh/functioncompute/fc-3-0/user-guide/gpu-instance-model-storage-best-practices
FC GPU FAQ(模型托管、模型预热):https://help.aliyun.com/zh/functioncompute/fc-3-0/support/faq-about-gpu-accelerated-instances-1
FC GPU 应用模板与示例代码:https://github.com/devsapp/start-fc-gpu/tree/v3
评论