向量检索服务产品规格
本文介绍向量检索服务 DashVector 的产品规格,以帮助用户选择贴合自身业务场景的实例规格。
实例类型
向量检索服务 DashVector 当前支持三种四种实例(Cluster)类型,以支持不同的业务场景和需求:
性能型 :适用于查询 QPS 高、查询延迟低的场景,同时性能型也是写入效率最高的实例类型。对于高并发、大流量、低延迟场景,或对写入效率有较高的要求的场景,可选择性能型实例。
存储型(推荐) :存储型相对于性能型有 5 倍的存储容量优势,能够存储和管理更多的向量数据,适用于大规模数据量的场景。存储型实例同样也具备优秀的技术指标, 可满足大部分场景需求 ,同时也是 性价比最高 的实例类型,推荐用户选择使用。
Serverless 型: 不限数据容量,基于用户数据自动扩缩,按实际请求收费,适用于低频 QPS 查询(QPS<2),延迟不敏感等场景。总体性能与存储型实例接近。
免费试用 :适用于测试、体验场景, 请勿用于线上生产环境 。免费试用实例有效期为 1 个月,到期后可再次申请试用。免费实例有部分试用限制,详情可参考约束与限制。
重要
免费试用实例有效期为 1 个月,到期后免费试用实例将自动释放,实例中的数据将被全部删除并清空且不可恢复,为了保证实例可持续使用,请您于创建免费试用实例之后的 30 个自然日内将免费试用实例升级为付费实例。免费试用实例由于到期且没有升级为付费实例而导致的数据被删除的情况,阿里云将不承担相关责任。
实例规格
向量检索服务 DashVector 针对性能型和存储型实例提供不同档位的实例(Cluster)规格,不同规格的主要区别在于存储容量的不同。Serverless 实例与已有性能型和存储型不同,无容量限制。
说明
若您有更高规格需求,或有任何反馈、期望获取更多技术支持,欢迎通过如下方式联系我们:
官方钉钉群:25130022704
技术支持邮箱:dashvector@service.aliyun.com
存储容量参考
重要
以上数据均已通过实际测试验证,但仅供参考!
上述用于容量测试的 Doc 中不包含任何 Fields,仅包含主键和向量数据 ,主键为从零开始自增正整数转字符串。大部分实际生产场景中,Fields 是不可或缺的,Fields 数据同样会占用存储空间,从而导致实际存储的 Doc 数低于上述表格。
检索性能参考
重要
以上数据为基于Cohere数据集实测结果,但由于不同数据集的数据分布对性能有影响,上述数据仅供参考。
上述用于性能测试的 Doc 中不包含任何 Fields,仅包含主键和向量数据 ,主键为从零开始自增正整数转字符串。
向量检索服务 DashVector 会定时在后台进行向量索引优化,通常在写入完成后 4 小时完成,届时性能达到最优状态。
不同规格在写满数据情况下,QPS 与上述表格中保持一致或更高,不因数据量的增加而下降。如,P.2xlarge 规格,在写满 2 百万 768 维 FP32 向量数据情况下,topk=100 的 QPS 可达到 600+。
副本数
向量检索服务 DashVector 支持调整副本数,可选范围为 1-5。副本之间数据完全相同,副本数越大,可支持的 QPS 越高,呈线性关系。同时副本数越大,服务可用性越高, 建议对可用性有较高要求的生产环境选择>=2 的副本数 。{#4d1b3cb1c1c9m}说明
需要注意,副本数的增加和减少不会影响存储容量,仅影响 QPS 和可用性。
Serverless 实例无副本概念,由系统管理。
版权声明: 本文为 InfoQ 作者【DashVector】的原创文章。
原文链接:【http://xie.infoq.cn/article/7c33e9f47e6adf658bfc729ba】。文章转载请联系作者。
评论