写点什么

DeepSeek v3

0 人感兴趣 · 18 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/0b/0b612a98b4390c7d47581e3528b0aa50.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

「DeepSeek-V3 技术解析」:多头潜在注意力机制(MLA)

编者按: 模型在生成长序列文本时,键值缓存占用的显存是否让 GPU 不堪重负?如何在保持模型性能的同时有效降低大语言模型推理阶段的内存占用?

https://static001.geekbang.org/infoq/35/3547dbec09af67fcba38eb1caf727c05.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

和鲸走入同济大学校园,从 GPT 到 DeepSeek,共启 AI 通识课新篇章

人工智能已成为二十一世纪最具挑战性、最具催化力、最具赋能特征的战略性技术,是发展新质生产力的重要引擎。同济大学面向时代急需、国家急需,勇担教育强国使命,把“人工智能+”作为教育发展的战略任务,并基于《人工智能赋能学科创新发展行动计划》,以人

https://static001.geekbang.org/infoq/82/82f126469ebc4fd0c8c746b53ee90303.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

DeepSeek 开源周 “王炸”:DualPipe 与 EPLB,榨干芯片算力的秘密武器

DeepSeek 开源 DualPipe 和 EPLB 项目,助力提升模型训练效率。DualPipe 通过重叠前后向计算通信,减少流水线气泡;EPLB 采用冗余专家策略平衡 GPU 负载。二者协同,大幅提高训练速度,充分利用芯片算力。

https://static001.geekbang.org/infoq/e5/e583201d6712e2a981012d7117983adb.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

DeepSeek Api 开发实践

春节前后,DeepSeek无疑是AI领域最火爆的话题,也在国内外掀起轩然大波。本篇介绍调研过的可稳定调用的DeepSeek API,以及调用方式和注意事项,供项目使用参考。

零门槛、百万 token 免费用,即刻拥有 DeepSeek-R1 满血版,还有实践落地调用场景等你来看

2025年春节可谓热闹非凡,宏观上来说是疫情后经济形势逐渐好转的重要起点,传统上来说是中国人阖家团圆的幸福节日,承载着每一位打工人的期盼与喜悦。在这个充满欢乐的时刻,国漫产业迎来了历史性突破,《哪吒2》票房一路高歌猛进,掀起全民观影热潮,“闹吒

https://static001.geekbang.org/infoq/13/13de18f4b42637f7bc25a8fd1969d738.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

LLMOps+DeepSeek:大模型升级一体化运维

嘉为蓝鲸LLMOps平台+DeepSeek:为运维全生命周期及业务通用AI 场景提供工具支持与自定义扩展能力,更有10+震撼智能运维场景分享!

MarsCode 编程助手模型升级至豆包大模型 1.5,同时支持切换 DeepSeek R1 / V3!

MarsCode 模型升级至豆包大模型1.5,还可切换DeepSeek R1/V3,无需配置,三款模型灵活切换,更准确,更强大!

澜舟智搭×DeepSeek:企业智能体平台全面升级,打造 AI Agent 应用新范式

当前,若论最为炙手可热的国产开源大模型是哪一个?想必毫无疑问当属 DeepSeek。

https://static001.geekbang.org/infoq/56/562f755632e49db2dd0be724cd9e2fad.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

强化版|伊克罗德信息 ECRobot 正式接入 DeepSeek R1 大模型

仅需一键调用,企业用户即可快速集成语言理解、智能对话、数据分析等AI能力。两种便捷的接入方式,满足不同需求!

Blackbox.ai:一站式 AI 代理,畅享顶级模型

最近Deepseek火遍大江南北,一夜之间到处都能看到有人在体验AI技术。然而这也带来了一些困难:由于服务器压力过大,ds开始使用了一些限流的措施。

https://static001.geekbang.org/infoq/59/596b65713fa380e894e68d1c2660a1b5.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

DS 缩写乱争:当小海豚撞上 AI 顶流,技术圈也逃不过“撞名”修罗场

曾几何时,技术圈提到DS,人们脑海中浮现的是一只灵动的“小海豚”——Apache DolphinScheduler(简称DS)。这个2019年诞生的分布式任务调度系统,凭借可视化DAG界面、多租户支持和对Hadoop/Spark生态的深度集成,一度是大数据工程师的“梦中情工”。然而,命

DeepSeek-R1 671b 全参模型满血上线

春节前夕,DeepSeek 新发布的 V3 基础大模型和 R1 推理大模型,引爆全球科技圈,国内外媒体和科技领袖对其赞誉有加。作为开源模型,DeepSeek-V3 和 DeepSeek-R1 效果比肩海外巨头的闭源模型,不仅以低至 1/10 的训练成本实现了与顶尖产品相媲美的性能,更在推

https://static001.geekbang.org/infoq/7c/7c3cef424531cfe2fbd0eeaae5c0c184.webp?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

DeepSeek 不需要解释,对 Anthropic CEO 就该贴脸开大

我发现,对 AI 竞争的看法,是一块很好的试金石,能折射出不同观点的光谱。

https://static001.geekbang.org/infoq/23/2346eee49a13b6b1ad4649d54688895b.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

一文教你如何本地部署玩转 DeepSeek-V3,免费体验 100 度算力包跑通!

只需三步,免费体验100度算⼒包就能完成DeepSeek-V3的私有化部署。

https://static001.geekbang.org/infoq/1c/1cfc9d6fe454c5dfdc672169a4bdd024.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

DeepSeek v3 为何爆火?如何用其集成 Milvus 搭建 RAG?

用户头像
Zilliz
01-06

本篇文章,我们会对DeepSeek v3的亮点进行梳理,并对其RAG搭建流程与效果,做一个简单的示例。

DeepSeek v3_DeepSeek v3技术文章_InfoQ写作社区