写点什么

KVCache

0 人感兴趣 · 11 次引用

  • 最新
  • 推荐

案例|蓝耘科技×焱融 YRCache 共同打造新一代 AI 推理算力平台

用户头像
焱融科技
2025-12-08

蓝耘科技携手焱融科技,基于焱融 YRCache 推理存储,共同打造新一代 AI 推理算力平台。在实际应用中,相较开源推理框架,平台性能大幅跃升:单服务器 Token 吞吐量提升 68.2%,并发能力提升 3 倍,为用户带来更低延迟、更稳定、更流畅的推理体验。

深度解析 YRCache 多机共享丨打破跨节点 KVCache 缓存壁垒 尽释大规模 GPU 推理集群计算潜能

用户头像
焱融科技
2025-11-11

焱融科技专门面向 AI 推理场景的 KVCache 管理优化方案——YRCache,创新引入了多机共享缓存机制,通过分层架构与智能管理策略,实现了多机环境下的 KV 缓存高效共享,显著提升了大规模 GPU 集群的整体资源利用率与推理性能。

焱融科技携手哈工大(深圳)共启 AI 推理存储研究,推进 AI 基础设施创新

用户头像
焱融科技
2025-10-16

国内领先的高性能存储厂商焱融科技携手哈尔滨工业大学(深圳)共同启动“面向未来 AI 推理存储”研究项目。此次合作聚焦于 AI 推理场景下的高性能数据访问与缓存优化,旨在打破算力与存储间的性能瓶颈,探索更高效、更智能的基础设施架构。

让 GPU 更轻盈 让推理更流畅|焱融 YRCache 双异步技术激活 AI 新价值

用户头像
焱融科技
2025-09-26

焱融 YRCache 推理加速方案发布最新的实测数据:基于异步卸载与异步加载两大核心创新,释放 GPU 显存,降低推理成本,大幅提升推理效率,轻松支持 32K、128K 及更长上下文的流畅处理,并实现跨节点缓存共享,为用户带来高性能、低成本的大模型推理体验。

医疗 AI Agent 最佳实践|焱融 YRCache 将推理效率提升 65%,实现患者问诊秒级响应

用户头像
焱融科技
2025-08-21

焱融YRCache推理方案为一家互联网医疗企业的 AI Agent 构建 PB 级高速持久化存储,实现推理效率与成本的双重优化:整体推理效率提升 65%,同等算力资源的并发支撑能力提升 2 倍以上。用户体验的改善带动付费用户数量增长 38%,为该企业业务增长提供有力支撑。

焱融科技携手信通院、青云科技启动“AI 推理高性能存储技术推进计划”

用户头像
焱融科技
2025-07-23

7月23日下午,在2025可信云大会-云基础设施智能化分论坛现场,焱融科技携手中国信通院、青云科技正式启动“AI 推理场景高性能存储技术推进计划”。三方将依托优势资源,深化合作,加快适配大模型推理场景的高性能存储体系建设。

聚焦全球数字经济大会 | 焱融存储推理加速方案成现场焦点

用户头像
焱融科技
2025-07-07

焱融存储最新技术成果 YRCloudFile KVCache 推理加速方案,亮相 2025 全球数字经济大会,面向全球观众展示了公司在 AI 存储领域的技术突破能力,成为现场备受瞩目的创新成果之一。

加速 AI 推理,焱融全闪存储成就 KVCache 以存换算关键一跃

用户头像
焱融科技
2025-06-04

KVCache 作为AI推理加速技术的核心方案备受业界关注,而其高效落地的关键在于全闪存储 —— 仅当存储访问延迟低于计算延迟时,“以存换算” 才能实现加速价值。焱融全闪存储以世界级领先性能保障极低延迟的 KVCache 存储访问,释放 AI 推理性能。

用户实测 YRCloudFile KVCache 丨以存代算显著提升 AI 推理性价比

用户头像
焱融科技
2025-05-16

YRCloudFile KVCache 在用户实际 AI 推理业务中展现出卓越性能:在将 TTFT 控制在 2 秒的用户体验红线内的情况下,并发能力较原生 vLLM 提升 3.2 倍。充分证明了其保障快速推理响应与高并发支持的能力,全面提升大语言模型推理的性价比。

推理性能提升 13 倍,延时缩短超 4 倍丨实测焱融 YRCloudFile KVCache

用户头像
焱融科技
2025-04-03

实测结果表明,YRCloudFile KVCache 在长上下文处理和高并发场景下展现出卓越性能优势:在长上下文任务中,TTFT 性能提升可达 13 倍。在 TTFT≤2 秒的严苛约束下,相同 GPU 配置下的并发支持能力提升 8 倍,同时在高并发负载下,延迟降低超过 4 倍。

官宣|焱融 YRCloudFile 发布面向 AI 推理的分布式 KV Cache 特性

用户头像
焱融科技
2025-03-18

焱融文件存储系统 YRCloudFile 发布面向 AI 推理的分布式KV Cache特性,为 AI 推理带来显著价值提升。用户可以在不增加 GPU 资源的情况下,实现更高并发的推理请求,大幅降低 GPU 资源消耗与投入成本。

KVCache_KVCache技术文章_InfoQ写作社区