向量检索服务的基本概念
本文主要介绍向量检索服务的基本概念、产品优势。
前置概念
阅读本文前,您可能需要了解如下概念:
什么是向量检索服务
向量检索服务 DashVector 基于通义实验室自研的高效向量引擎 Proxima 内核,提供具备水平拓展能力的云原生、全托管的向量检索服务。DashVector 将其强大的向量管理、向量查询等多样化能力,通过简洁易用的SDK/API接口透出,方便被上层 AI 应用迅速集成,从而为包括大模型生态、多模态 AI 搜索、分子结构分析在内的多种应用场景,提供所需的高效向量检索能力。
产品地址
产品首页:https://www.aliyun.com/product/ai/dashvector
控制台首页:https://dashvector.console.aliyun.com
产品优势
多维度高精度: 依据不同数据维度和分布选择不同算法或算法组合,根据具体场景需求实现精度和性能之间的平衡。
实时在线更新: 采用扁平化的索引结构,支持在线大规模向量索引的从 0 到 1 的流式构建,实现了索引即增即查、即时落盘,以及实时动态更新。
高性能低成本: 有限成本下实现最大化性能并满足业务的需求。
多场景适配: 结合超参调优和复合索引等方法,提高系统的自动化能力,以及增强用户的易用性。
超大规模索引构建和检索: 引入复合性检索算法,精于工程实现和算法底层优化,低成本实现高效率的检索方法,单片索引可达几十亿的规模。
标签+向量检索: 在索引算法层实现了"带条件的向量检索",解决了传统多路归并召回结果不理想的情况,满足组合检索的要求。
索引水平扩展: 采用非对等分片方法实现分布式检索,支持有限精度下索引的快速合并,与 Map-Reduce 计算模型可有效结合。
异构计算: 支持大批量高吞吐的离线检索加速,支持 GPU 构建邻居图索引,成功实现小批量+低延时+高吞吐的资源利用。
Serverless :支持 Serverless 能力,为用户提供按需使用、弹性扩缩和免运维的使用体验。
版权声明: 本文为 InfoQ 作者【DashVector】的原创文章。
原文链接:【http://xie.infoq.cn/article/913a29a58a7f375c3546d5d7d】。文章转载请联系作者。
评论