写点什么

炸了!AWS 推出 S3 Vectors

  • 2025-07-23
    浙江
  • 本文字数:1524 字

    阅读完需:约 5 分钟

AWS 上周推出了 Amazon S3 Vectors,这是一种新型存储桶,是首款原生支持向量存储和查询的云对象存储,让客户能够直接在 S3 中存储和查询大量向量嵌入。AWS 表示,这款新的云服务能够从 S3 提供亚秒级查询响应,同时将向量查询成本降低高达 90%。

向量嵌入是非结构化数据(例如图像、文本、视频和音频)的压缩表示,是新兴人工智能范式的关键组成部分。组织机构使用向量嵌入、向量索引和相似性搜索来提升网络搜索的质量(称为向量搜索),并在生成式人工智能和代理式人工智能应用中提升相关数据的记忆和回忆能力,这一过程被称为检索增强生成 (RAG)。

据 AWS 称,客户可以在 S3 Vectors 中存储数十亿个向量嵌入,S3 Vectors 拥有一套专用的 API 来存储、访问和查询向量,而无需配置任何额外的基础设施。该产品已与 Amazon Bedrock Knowledge Bases(包括 Amazon SageMaker Unified Studio)预先集成,并且可与支持内存向量存储和检索的 Amazon OpenSearch Service 配合使用。

Amazon OpenSearch 针对少量对象的快速向量检索进行了优化,而 S3 Vectors 则针对大量向量的经济高效向量存储进行了优化。该公司表示,客户可以根据应用的需求在 OpenSearch 和 S3 Vectors 之间来回迁移向量。

AWS Cloud 首席开发倡导者 Channy Yun 在一篇博客文章中写道:“借助 S3 Vectors,您现在可以经济地存储代表大量非结构化数据(如图像、视频、文档和音频文件)的向量嵌入,从而实现可扩展的生成 AI 应用程序,包括语义和相似性搜索、RAG 和构建代理内存。您无需管理向量数据库的复杂性和成本,就可以构建应用来支持广泛的行业用例,包括个性化推荐、自动内容分析和智能文档处理。”

S3 Vectors 有很多潜在的用例。AWS 表示,媒体公司可以使用它来索引数百万小时的视频,以便立即显示相关场景。与此同时,医疗保健提供商可以对数十亿张医学图像进行向量化,以帮助加速疾病诊断。

据悉,AWS 根据客户上传的向量数量、客户在向量、元数据和密钥中存储的数据量以及客户查询向量的次数来收取 S3 向量的费用。

对向量数据库市场的冲击

S3 Vectors 的推出对现有向量数据库供应商(如 Pinecone、Weaviate、Qdrant、ChromaDB)构成直接挑战:

成本:AWS 声称 S3 Vectors 可降低高达 90% 的成本。以一个包含 1000 万个向量的用例为例,S3 Vectors 的年存储成本约为 $16.56($0.023/GB/月),而 Pinecone 的年成本可能高达 $13,271,Weaviate 云端部署约为 $10,200,Qdrant 自托管在 AWS 上的年成本约为 $12,306。这种价格优势对预算敏感的企业(尤其是中小企业)极具吸引力。

数据驻留与简化架构:传统向量数据库需要将数据从 S3 复制到外部服务,导致数据冗余和 ETL 复杂性。S3 Vectors 允许在 S3 中直接存储和查询向量,消除了数据移动成本,降低了架构复杂性。业内讨论指出,这种“零拷贝”策略不仅降低成本,还通过将数据保留在 AWS 生态内增强了锁定效应。

市场份额:向量数据库市场预计到 2030 年将增长至约 100 亿美元,年复合增长率超 20%。 S3 Vectors 的低成本和高集成性可能削弱独立向量数据库的增长势头,尤其是在 AWS 客户群中。有网友评论提到,AWS 此举可能“扼杀向量数据库初创公司”。

然而,S3 Vectors 的性能(亚秒级查询)在高 QPS 、实时性场景下(如实时推荐系统)不如 OpenSearch 或专用向量数据库(低延迟、内存/SSD 驱动)。因此,S3 Vectors 更适合低频查询的“冷”数据存储,而非实时高性能场景,这限制了其对高端市场的威胁。

竞争对手的反应

Azure 目前依赖其数据库服务(如 Cosmos DB)支持向量,但缺乏与 S3 Vectors 类似的原生对象存储集成。Google Cloud 的 BigQuery 和 Vertex AI 可能面临类似压力,尤其是在成本敏感的市场中。AWS 的先发优势可能迫使竞争对手加速创新或降低价格。

发布于: 刚刚阅读数: 2
用户头像

经百万用户验证的AI就绪数据基础设施提供商 2024-06-14 加入

以一份数据为基础,提供原生稳定、极致性价比、按需付费的交互式分析、实时分析以及ETL服务。助力传统数据平台升级为 AI-ready 数据平台,促进 AI 在企业严谨生产场景的落地,提高准确性、数据洞察力、决策效率。

评论

发布
暂无评论
炸了!AWS 推出 S3 Vectors_AI_AI数据云Relyt_InfoQ写作社区