爆火的 Deepseek 初体验

爆火的 Deepseek 初体验
DeepSeek 出现并爆火的意义是,它让一个普通人使用 AI 的门槛快速降低

概述
2022 年 11 月 30 日,OpenAI 正式发布了 ChatGPT,它一经推出就迅速引起了全球范围内的广泛关注,因为它展示了强大的语言生成能力,能够进行流畅的对话、回答问题、撰写文本等多种任务。ChatGPT 的发布标志着自然语言处理技术的一个重要里程碑,开启了人工智能在语言交互领域的新篇章。
继 ChatGPT 成为全世界的焦点后,OpenAI 再一次引爆了科技圈。
北京时间 2 月 16 日凌晨 2 点左右,美国 OpenAI 公司正式发布其首个文本-视频生成模型 Sora。据报道,Sora 能够根据文本提示创建详细的视频、扩展现有视频中的叙述以及从静态图像生成场景。
近期被 Deepseek 爆火刷屏,主要原因如下:
高性能与低成本:DeepSeek 的 R1 模型在性能上足以与 OpenAI 的 O1 模型相媲美,在数学、代码、自然语言推理等任务上表现出色。例如,在 AIME 2024 数学基准测试中,DeepSeek R1 的成功率达到 79.8%,超越了 OpenAI 的 o1 推理模型。同时,其训练成本极低,仅用不到 600 万美元和 2048 块低性能的 H800 芯片,训练时间仅用两个月。
开源模式:DeepSeek 的模型完全开源,全球开发者都可以免费使用和测试。这种开源模式不仅降低了使用门槛,还吸引了大量开发者参与创新,促进了技术的共享与发展
于是很小伙伴都想亲身体验一番,DeepSeek 的出现使得大模型“平民化”了,这里我整理了一份个人的实操手册供大家参考,首先我们需要到下载安装包Ollama

安装 Ollama

部署 AI 大模型
安装完成之后需要部署模型才能运行,我们需要选择一个合适的模型。
这里可以看到有很多流行的模型推荐:

根据自己的电脑配置选择模型进行部署,这里我选择的是

完成之后如下所示:

然后开始使用起来!

每次通过如下方式可以进入使用:
ollama list

运行如下命令可以进入对话模式:
ollama run 模型名称(NAME)
版权声明: 本文为 InfoQ 作者【能源恒观】的原创文章。
原文链接:【http://xie.infoq.cn/article/45a641bb395343fa14d059276】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论