DeepSeek
0 人感兴趣 · 224 次引用
- 最新
- 推荐

「DeepSeek 技术解析」:LLM 训练中的强化学习算法
编者按: 本文首先解析了为什么 LLM 训练需要强化学习,详细讲解了 RL 和 RLHF 的工作原理;继而系统比较基于价值、基于策略和 Actor-Critic 三大强化学习范式的优缺点;最后深入剖析 TRPO 和 PPO 算法,重点展示 GRPO 如何通过分组结构和相对优势估计实现训

PD 分离推理的加速大招,百度智能云网络基础设施和通信组件的优化实践
为了适应 PD 分离式推理部署架构,百度智能云从物理网络层面的「4us 端到端低时延」HPN 集群建设,到网络流量层面的设备配置和管理,再到通信组件和算子层面的优化,显著提升了上层推理服务的整体性能。

DeepSeek 谈运维:AI 时代运维资源升级,从数据资产到智能能力的进阶之路
革新传统运维模式,通过六类资源智能化重构与动态协同,构建闭环自治网 络,提升运维效率并驱动未来智能生态。

立即报名!5 月 9 日 19 点,航遥中心教授级高工解析大模型如何赋能科研
本周五(5.9)19点,和鲸特邀航遥中心于峻川老师做大模型赋能科研分享,围绕AI4S如何驱动科研范式升级及AI+遥感应用,帮助更多科研人员和技术爱好者打开实践新思路!

Bolt.diy 评测方案:从部署到创意实践的全方位探索
Bolt.diy 是阿里云推出的低代码开发平台,基于函数计算(FC)与百炼大模型服务构建。它通过自然语言交互、全栈开发支持及快速云端部署,让开发者和非技术人员能轻松实现创意落地。


DeepSeek 对我国算力的影响力有多大?
DeepSeek技术突破和市场定位使其在AI领域产生深远影响。一流的性能表现、大幅降低的算力成本和开源模式推动AI技术普及和发展。驱动算力需求的变革,促进算力产业链的重构,并为大模型的广泛应用打下夯实的基础。


云上玩转 DeepSeek 系列之六:DeepSeek 云端加速版发布,具备超高推理性能
PAI 正式推出了优化版 DeepSeek-R1 模型 DeepSeek-R1-PAI-optimized,将大模型推理效率推向了 Next Level。

Dify+DeepSeek 实战教程!企业级 AI 文档库本地化部署,数据安全与智能检索我都要
上次折腾完 DeepSeek 的本地私有化部署后,心里就一直琢磨着:能不能给咱们 Rainbond 的用户再做点实用的东西?毕竟平时总收到反馈说文档查找不够方便,要是能有个 AI 文档助手该多好。正想着呢,搭建本地知识库的想法就冒了出来 —— 既能解决实际需求,又能

「DeepSeek-V3 技术解析」:DeepSeek-V3-Base 预训练阶段解析
编者按: 这篇技术解析详细阐述了 DeepSeek-V3-Base 的预训练阶段所采用的关键技术。

3FS 系列(三):从源码到实测:3FS USRBIO 静态库的编译与性能体验
3FS系列(三):从源码到实测:3FS USRBIO静态库的编译与性能体验


DeepSeek 大模型 Prompt 工程深度实践(开发者空间 Notebook 版)
Prompt工程技术即提示工程技术(Prompt Engineering), 是一种通过精心设计输入文本即提示(Prompt)来引导大语言模型(LLM)生成高质量输出的技术。它属于自然语言处理(NLP)领域,Prompt是用户向模型提供的输入指令,通常以自然语言文本的形式出现,核

DeepSeek :中国 AI 如何用 “小米加步枪” 逆袭硅谷
2025 年春节前夕,人工智能领域诞生了一项重大成果 ——DeepSeek 发布DeepSeek - R1 大模型。这一模型迅速引发广泛关注,在苹果 AppStore 中国区免费榜登顶。

精彩抢先看!博睿数据将亮相 GOPS 全球运维大会 2025 深圳站
博睿数据(bonree.com,股票代码688229)受邀出席本次大会,产品中心总监贺安辉将亮相”可观测性“专场,分享《Bonree ONE 一体化智能可观测平台:LLM+智能运维双擎智变》的主题演讲。


「DeepSeek-V3 技术解析」:多词元预测技术(Multi-Token Prediction, MTP)
编者按: 在实时人工智能应用场景中,大语言模型的推理速度直接影响用户体验。传统模型通过逐词元预测(next-token prediction)生成文本,每次仅预测一个词元的方式导致长文本生成耗时较长。这种延迟在对话系统和内容创作平台中尤为明显,已成为阻碍用户沉浸

基于 DeepSeek GRPO 的 1.5B Rust 代码生成模型训练实战
编者按: 群组相对策略优化(GRPO)如何让小型专用模型在特定任务上实现性能提升?我们今天为大家带来的这篇文章展示了如何使用 GRPO,训练一个仅有 1.5B 参数的 Rust 代码生成模型,实现性能大幅提升。