小白秒变 AI 大神!DeepSeek 方 + 第三方 + 命令行调用指南,10 分钟搞定
DeepSeek 介绍
DeepSeek 是杭州深度求索人工智能基础技术研究有限公司,开发的一个 AI 产品平台,这家公司陆续发布了多款大语言模型。对外提供了大模型服务与接口调用平台。

DeepSeek 模型列表
DeepSeek 陆续发布过如下大模型,目前最新的核心大模型是 DeepSeek V3 系列模型与 DeepSeek R1 模型。 {.audio .d-block}
DeepSeek R1
DeepSeek V3
DeepSeek Coder V2
DeepSeek VL
DeepSeek V2
DeepSeek Coder
DeepSeek Math
DeepSeek LLM
DeepSeek Chat V3 模型
DeepSeek V3 为自研混合专家模型,671B 参数,激活 37B,在 14.8T token 上进行了预训练。 DeepSeek V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1 405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。

DeepSeek R1 模型
deepseek-reasoner 是 DeepSeek 推出的推理模型。在输出最终回答之前,模型会先输出一段思维链内容,以提升最终答案的准确性。DeepSeek R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

核心模型价格
这是两个主要模型的参数和使用价格。核心参数是上下文 64k,最大输出 8k。虽然官方提供的服务是收费的,但是我们可以通过部署。 deepseek 的开源模型实现免费使用。在集成到 dify 的时候,你需要按照这些参数填写相关的配置。
DeepSeek 使用方式
DeepSeek 的使用方式主要包含如下几个方式。
通过 DeepSeek 官网 http://deepseek.com
第三方服务,基于 DeepSeek 开源模型搭建起来的服务
官方的 API 调用,可以绕过一些界面问题
霍格沃兹测试开发学社搭建的 dify ollama 服务
本地部署开源版本的大模型

openai 命令行调用方式
除了使用网页界面外,官方也支持通过多种其他的方式调用,比如命令行的方式、api 调用方式等。因为 DeepSeek 兼容 openai 的 api,所以我们可以使用 openai 的命令行工具进行调用。openai 的 python 包本身也是基于 http 接口进行的调用封装。
curl 命令调用方式
当然也可以直接调用官方的 http 接口。使用任意语言或者 http 请求发送工具进行调用。
python 编程调用
这是 openai python 库调用的例子,当然也可以使用任何第三方的封装库,因为 openai 的 api 已经是行业事实上的标准,而 DeepSeek 又兼容了 openai 的 api,所以所有的大模型开发框架都支持 DeepSeek。比如 lang chain langgraph autogen 等。
评论