如何使用 DashVector 的多向量检索

本文介绍如何使用 DashVector 的多向量检索功能。
在某些 AI 检索的场景,会涉及一个实体对应多个向量,在检索时希望通过多个向量检索来找到最可能的实体,例如:
在自然语言处理中,标题和文档分别抽取为不同的向量特征,需要根据标题向量和文档向量同时做检索。
在商品检索时,商品的图片和文字分别抽取为不同的向量特征,需要根据图片向量和文字向量同时做检索。
为了满足这些需求,DashVector 支持了多向量检索。
使用示例
前提条件
已创建 Cluster
已获得 API-KEY
已安装最新版 SDK
创建多向量集合
说明
需要使用您的 api-key 替换示例中的 YOUR_API_KEY、您的 Cluster Endpoint 替换示例中的 YOUR_CLUSTER_ENDPOINT,代码才能正常运行。
复制代码
插入数据
说明
insert/upsert 要求至少一个向量字段有值。
复制代码
执行检索
说明
检索时采用的策略为多个向量分别执行检索后融合排序。
VectorQuery 支持的其他参数见 向量检索高级参数。
复制代码
限制说明
重要
当前单个集合最多支持 4 个向量字段。
随向量字段的个数增加,Cluster 中可插入的 Doc 条数会减少,插入和检索的性能会下降。
检索时允许只对部分向量做检索,集合中包含 n 个向量字段时,允许使用 1-n 个向量字段做向量检索,允许使用其中的任意一个向量字段做分组向量检索。







评论