腾讯云发布 TencentOS AI 加速版，助力 DeepSeek 私有化场景推理提速 100%

2025-02-24
北京
本文字数：730 字
阅读完需：约 2 分钟

DeepSeek 的私有化部署之痛

为了获得更好的数据安全性以及合规性，同时满足 AI 定制化的要求，很多企业会在私有化场景中部署 DeepSeek，而私有化场景的部署通常需要大量的 GPU 资源来支撑。

由于“群众“对 DeepSeek 的火热，进而带来了极大的私有化 DeepSeek 的访问压力，对资源的需求也会大幅增加，最终很容易引发“雪崩”效应，导致较差的使用体验。因此，企业急需一个既不增加服务器资源，又能丝滑使用 DeepSeek 的方案，来提升私有化 DeepSeek 的使用感受，解决诸如“响应慢”、“服务器繁忙”等问题的困扰。

TencentOS Server AI 加速版正式发布

针对用户在私有化场景遇到的 DeepSeek“服务器繁忙”的问题，腾讯云正式发布“TencentOS Server AI 加速版”，可以在不增加 GPU 资源的情况下，通过软件栈技术优化大幅增加 DeepSeek 的处理能力。例如在对话、智能客服以及代码生成等场景均能够获得 100%的性能提升，这帮助用户更加丝滑地享受 DeepSeek 带来的技术红利。

TencentOS Server AI 加速版对大语言模型业务进行了专门的内核运行优化，同时，TencentOS Server AI 加速版提供 TACO-LLM 加速模块，用于提高大语言模型的推理效能，为客户提供兼顾高吞吐和低延时的优化方案。

TencentOS Server AI 加速版能够“无缝”的整合到现有的 DeepSeek 部署方案中，所以，不管是新增的 DeepSeek 部署，或者是现有已运行的 DeepSeek 架构改造，TencentOS AI 加速版都得心应手。

在一个典型代码生成类场景的测试中，使用 DeepSeek-R1-Distill-Llama-70B 模型，输入 1k Tokens，输出 2k Tokens 的情况下，在 TencentOS Server AI 加速版中运行 DeepSeek 能够获得相比其他社区开源部署方案近 100%的推理性能（Token 吞吐量）的提升。

即刻部署 TencentOS Server AI 加速版，开启新的 DeepSeek“速度与激情”！

发布于: 刚刚阅读数: 3

OpenCloudOS

关注

还未添加个人签名 2022-05-24 加入

还未添加个人简介

发布

暂无评论

创作场景

腾讯云发布 TencentOS AI 加速版，助力 DeepSeek 私有化场景推理提速 100%

DeepSeek 的私有化部署之痛

TencentOS Server AI 加速版正式发布

OpenCloudOS

评论