写点什么

大模型推理优化

0 人感兴趣 · 1 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/af/afaf1dade1ae8a83aebd31f0140feede.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

AIBrix: 专为 vLLM 打造的可扩展、高性价比控制面

由字节跳动开发的vllm-project/aibrix项目正式发布。AIBrix是基于Kubernetes的推理系统项目,旨在提供可扩展且高性价比的vLLM控制平面。AIBrix自2024年初开始研发,已成功部署到字节跳动的多个业务场景,展示其在大规模部署中的可扩展性和高效性。

大模型推理优化_大模型推理优化技术文章_InfoQ写作社区