写点什么

DeepSeek

0 人感兴趣 · 224 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/2f/2f6c15b0d8f038bd426cd3b4013d38d1.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

「DeepSeek 技术解析」:LLM 训练中的强化学习算法

编者按: 本文首先解析了为什么 LLM 训练需要强化学习,详细讲解了 RL 和 RLHF 的工作原理;继而系统比较基于价值、基于策略和 Actor-Critic 三大强化学习范式的优缺点;最后深入剖析 TRPO 和 PPO 算法,重点展示 GRPO 如何通过分组结构和相对优势估计实现训

首批!火山引擎通过中国信通院《边缘大模型网关技术要求》

近期,中国信息通信研究院牵头制定《边缘大模型网关技术要求》,为人工智能技术在边端侧实践应用提供参考指引。火山引擎边缘云参与标准制定,针对标准框架和标准内容提出编制意见,推动标准发布,为边缘 AI 产业的发展贡献力量。标准发布后,火山引擎边缘大模

https://static001.geekbang.org/infoq/f3/f3f21f8add7b84b7d2f01fedb48c4ff2.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

怎么用 DeepSeek 一键生成思维导图?DS 最新使用技巧分享!

遇事不决,先问deepseek。DeepSeek已逐渐融入到每个人日常办公、学习和生活的方方面面,除了大家熟悉的AI聊天对话,不少人也在努力发掘DeepSeek的更多用法,包括DeepSeek生成PPT、DeepSeek生成思维导图、DeepSeek生成图片、DeepSeek生成视频、DeepSeek生成UI

https://static001.geekbang.org/infoq/ed/ed5531b972b7cd2938c5563778eca321.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

从被动响应到主动预防:AI 驱动下的运维流程革命

大模型下运维PPTR各要素转型,人机协作提效,构建智能运维新生态。

PD 分离推理的加速大招,百度智能云网络基础设施和通信组件的优化实践

为了适应 PD 分离式推理部署架构,百度智能云从物理网络层面的「4us 端到端低时延」HPN 集群建设,到网络流量层面的设备配置和管理,再到通信组件和算子层面的优化,显著提升了上层推理服务的整体性能。

https://static001.geekbang.org/infoq/68/68d6216fd377ce1981a088d1ce085ff9.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

DeepSeek 谈运维:AI 时代运维资源升级,从数据资产到智能能力的进阶之路

革新传统运维模式,通过六类资源智能化重构与动态协同,构建闭环自治网 络,提升运维效率并驱动未来智能生态。

https://static001.geekbang.org/infoq/1f/1fe931c9b5897bc3c977e8c523d750ae.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

立即报名!5 月 9 日 19 点,航遥中心教授级高工解析大模型如何赋能科研

本周五(5.9)19点,和鲸特邀航遥中心于峻川老师做大模型赋能科研分享,围绕AI4S如何驱动科研范式升级及AI+遥感应用,帮助更多科研人员和技术爱好者打开实践新思路!

https://static001.geekbang.org/infoq/8c/8c2a2b4cb27bdeb43157328d2fccb28d.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Bolt.diy 评测方案:从部署到创意实践的全方位探索

Bolt.diy 是阿里云推出的低代码开发平台,基于函数计算(FC)与百炼大模型服务构建。它通过自然语言交互、全栈开发支持及快速云端部署,让开发者和非技术人员能轻松实现创意落地。

https://static001.geekbang.org/infoq/bf/bf38b16f706d46bf9053c8daf0f2c5f2.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

基于 DeepSeek 的故障定位大揭秘

引入DeepSeek后,大模型承担更多智能化工作,我们只需要提供数据源即可。

https://static001.geekbang.org/infoq/70/70e393279739006a85b9d5a3644bdccb.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

DeepSeek 对我国算力的影响力有多大?

DeepSeek技术突破和市场定位使其在AI领域产生深远影响。一流的性能表现、大幅降低的算力成本和开源模式推动AI技术普及和发展。驱动算力需求的变革,促进算力产业链的重构,并为大模型的广泛应用打下夯实的基础。

https://static001.geekbang.org/infoq/13/13c6f643b748c8aa752daa17ee046380.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

向量数据库与知识图谱:智能化运维的知识基石

AI驱动运维智能化演进,大模型+Agent+MCP协议实现自主运维,故障自愈率达85%,效率显著提升。

https://static001.geekbang.org/infoq/98/98fd1313da29212fbc32954f1de9c800.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

一图纵览!嘉为蓝鲸 2025 春季 11 大产品矩阵智焕新能

嘉为蓝鲸2025春季发布会推出AI赋能的智能运维矩阵,助力企业高效、安全、智能化运维升级。

云上玩转 DeepSeek 系列之六:DeepSeek 云端加速版发布,具备超高推理性能

PAI 正式推出了优化版 DeepSeek-R1 模型 DeepSeek-R1-PAI-optimized,将大模型推理效率推向了 Next Level。

https://static001.geekbang.org/infoq/14/14a9e36d7ece6009a8a9b4d5934c3c9d.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Dify+DeepSeek 实战教程!企业级 AI 文档库本地化部署,数据安全与智能检索我都要

上次折腾完 DeepSeek 的本地私有化部署后,心里就一直琢磨着:能不能给咱们 Rainbond 的用户再做点实用的东西?毕竟平时总收到反馈说文档查找不够方便,要是能有个 AI 文档助手该多好。正想着呢,搭建本地知识库的想法就冒了出来 —— 既能解决实际需求,又能

https://static001.geekbang.org/infoq/cb/cb12885c724d3964a33cda98b5432d8c.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

政企产品经理 AI 工作流分享:需求 ->产品的敏捷实现(深度长文)

政企行业产品经理如何利用AI工作流快速构建产品原型,以应对不断迭代的需求

https://static001.geekbang.org/infoq/78/780d5bd99430b979239b57db5ff2027f.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

DeepSeek 浪潮下,MedHELM 如何重塑 AI 医疗大模型评估?

DeepSeek 开源推动医疗智能化,多家医院已部署相关技术。大型语言模型在医疗领域潜力大,但传统评估方式有局限。 MedHELM 应运而生,经科学构建流程评估不同规模模型,发现其各有优劣。目前评估面临挑战,后续将持续优化,它有望推动医疗行业智能化升级。

https://static001.geekbang.org/infoq/62/6290c472186005a368f9a8b69bb4930c.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

「DeepSeek-V3 技术解析」:DeepSeek-V3-Base 预训练阶段解析

编者按: 这篇技术解析详细阐述了 DeepSeek-V3-Base 的预训练阶段所采用的关键技术。

https://static001.geekbang.org/infoq/3d/3dbdad120ab51a4c2bccf62600044e85.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

deepseek 如何制作 ppt?DS 高级使用技巧盘点!

DeepSeek对众多职场人来说,简直上大分,它拥有十八般武艺,可以按照我们的需求生成各式各样的内容,包括文本、表格、代码、Mermaid、PlantUML等。

https://static001.geekbang.org/infoq/bb/bb496efa46d8e2b611c35ebbbb510533.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

RAG 实战|用 StarRocks + DeepSeek 构建智能问答与企业知识库

文章作者: 石强,镜舟科技解决方案架构师 赵恒,StarRocks TSC Member

https://static001.geekbang.org/infoq/9e/9eaa6715d8a81499de219faa00398cba.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

DeepSeek 谈运维:AI 重塑审批流,打造 IT 运维高效工作流

AI赋能IT运维,从被动响应到智能主动,提升效率降低风险。

接入 DeepSeek API,超详细

从零开始,一步步完成 DeepSeek API 的接入,并编写你的第一个AI程序

从零到一开发 DeepSeek 智能聊天机器人

开发一个智能聊天机器人,旨在为用户提供自然、流畅的对话体验。通过集成 DeepSeek API,机器人能够理解用户输入并生成有意义的响应。

https://static001.geekbang.org/infoq/ba/ba64ef4daedd194411e819538d1a1faa.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

DeepSeek 大模型 Prompt 工程深度实践(开发者空间 Notebook 版)

‌Prompt工程技术即提示工程技术(Prompt Engineering), 是一种通过精心设计输入文本即提示(Prompt)来引导大语言模型(LLM)生成高质量输出的技术。它属于自然语言处理(NLP)领域,Prompt是用户向模型提供的输入指令,通常以自然语言文本的形式出现,核

https://static001.geekbang.org/infoq/b7/b7b97a91d13ec20084a58802c159ab89.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

DeepSeek :中国 AI 如何用 “小米加步枪” 逆袭硅谷

2025 年春节前夕,人工智能领域诞生了一项重大成果 ——DeepSeek 发布DeepSeek - R1 大模型。这一模型迅速引发广泛关注,在苹果 AppStore 中国区免费榜登顶。

https://static001.geekbang.org/infoq/04/0449a160bc4a89ee2c54fc55f299d7ee.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

精彩抢先看!博睿数据将亮相 GOPS 全球运维大会 2025 深圳站

博睿数据(bonree.com,股票代码688229)受邀出席本次大会,产品中心总监贺安辉将亮相”可观测性“专场,分享《Bonree ONE 一体化智能可观测平台:LLM+智能运维双擎智变》的主题演讲。

https://static001.geekbang.org/infoq/3d/3d089cb164adcc410c1d9915b51a5a08.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

「DeepSeek-V3 技术解析」:多词元预测技术(Multi-Token Prediction, MTP)

编者按: 在实时人工智能应用场景中,大语言模型的推理速度直接影响用户体验。传统模型通过逐词元预测(next-token prediction)生成文本,每次仅预测一个词元的方式导致长文本生成耗时较长。这种延迟在对话系统和内容创作平台中尤为明显,已成为阻碍用户沉浸

https://static001.geekbang.org/infoq/3c/3c9f520076ff75a05b27caab25a1175e.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

基于 DeepSeek GRPO 的 1.5B Rust 代码生成模型训练实战

编者按: 群组相对策略优化(GRPO)如何让小型专用模型在特定任务上实现性能提升?我们今天为大家带来的这篇文章展示了如何使用 GRPO,训练一个仅有 1.5B 参数的 Rust 代码生成模型,实现性能大幅提升。

DeepSeek_DeepSeek技术文章_InfoQ写作社区