写点什么

KVCache

0 人感兴趣 · 6 次引用

  • 最新
  • 推荐

焱融科技携手信通院、青云科技启动“AI 推理高性能存储技术推进计划”

7月23日下午,在2025可信云大会-云基础设施智能化分论坛现场,焱融科技携手中国信通院、青云科技正式启动“AI 推理场景高性能存储技术推进计划”。三方将依托优势资源,深化合作,加快适配大模型推理场景的高性能存储体系建设。

聚焦全球数字经济大会 | 焱融存储推理加速方案成现场焦点

焱融存储最新技术成果 YRCloudFile KVCache 推理加速方案,亮相 2025 全球数字经济大会,面向全球观众展示了公司在 AI 存储领域的技术突破能力,成为现场备受瞩目的创新成果之一。

加速 AI 推理,焱融全闪存储成就 KVCache 以存换算关键一跃

KVCache 作为AI推理加速技术的核心方案备受业界关注,而其高效落地的关键在于全闪存储 —— 仅当存储访问延迟低于计算延迟时,“以存换算” 才能实现加速价值。焱融全闪存储以世界级领先性能保障极低延迟的 KVCache 存储访问,释放 AI 推理性能。

用户实测 YRCloudFile KVCache 丨以存代算显著提升 AI 推理性价比

YRCloudFile KVCache 在用户实际 AI 推理业务中展现出卓越性能:在将 TTFT 控制在 2 秒的用户体验红线内的情况下,并发能力较原生 vLLM 提升 3.2 倍。充分证明了其保障快速推理响应与高并发支持的能力,全面提升大语言模型推理的性价比。

推理性能提升 13 倍,延时缩短超 4 倍丨实测焱融 YRCloudFile KVCache

实测结果表明,YRCloudFile KVCache 在长上下文处理和高并发场景下展现出卓越性能优势:在长上下文任务中,TTFT 性能提升可达 13 倍。在 TTFT≤2 秒的严苛约束下,相同 GPU 配置下的并发支持能力提升 8 倍,同时在高并发负载下,延迟降低超过 4 倍。

官宣|焱融 YRCloudFile 发布面向 AI 推理的分布式 KV Cache 特性

焱融文件存储系统 YRCloudFile 发布面向 AI 推理的分布式KV Cache特性,为 AI 推理带来显著价值提升。用户可以在不增加 GPU 资源的情况下,实现更高并发的推理请求,大幅降低 GPU 资源消耗与投入成本。

KVCache_KVCache技术文章_InfoQ写作社区