写点什么

如何通过 Python SDK 创建一个新的 Collection

作者:DashVector
  • 2025-08-15
    陕西
  • 本文字数:1127 字

    阅读完需:约 4 分钟

如何通过Python SDK创建一个新的Collection

本文介绍如何通过 Python SDK 创建一个新的 Collection。

前提条件

接口定义

Python 示例:


Client.create(    name: str,    dimension: int,    dtype: Union[Type[int], Type[float]]=float,    fields_schema: Optional[Dict[str, Union[Type[str], Type[int], Type[float], Type[bool], Type[long]]]]=None,    metric: str='cosine',    extra_params: Dict[str, Any]=None,    timeout: Optional[int]=None,    vectors: Union[None, VectorParam, Dict[str, VectorParam]] = None,    sparse_vectors: Union[None, Dict[str, VectorParam]] = None,) -> DashVectorResponse
复制代码

使用示例

说明


需要使用您的 api-key 替换示例中的 YOUR_API_KEY、您的 Cluster Endpoint 替换示例中的 YOUR_CLUSTER_ENDPOINT,代码才能正常运行。

创建单向量集合

Python 示例:


import dashvector
client = dashvector.Client( api_key='YOUR_API_KEY', endpoint='YOUR_CLUSTER_ENDPOINT')
# 创建一个名称为quickstart、向量维度为4、# 向量数据类型为float(默认)、# 距离度量方式为dotproduct(内积)的Collection# 并预先定义四个Field,名称为name、weight、age、id,数据类型分别为str、float、int、dashvector.long# timeout为-1 ,开启create接口异步模式ret = client.create( name='quickstart', dimension=4, metric='dotproduct', dtype=float, # 为保留类型注解的语义明确性,DashVector通过typing模块定义long类型,为需要显式标注大整数场景提供了类型标注支持 fields_schema={'name': str, 'weight': float, 'age': int, 'id': dashvector.long}, timeout=-1)

# 判断collection是否创建成功if ret: print('create collection success!')# 等同于下列代码# from dashvector import DashVectorCode# if ret.code == DashVectorCode.Success:# print('create collection success!')
复制代码

创建多向量集合

ret = client.create(    'multi_vector_demo',    vectors={        "title": VectorParam(4),        "content": VectorParam(6, metric="euclidean"),    },    sparse_vectors={        "abstruct": VectorParam(metric="dotproduct"),        "keywords": VectorParam(metric="dotproduct"),        # 稀疏向量索引目前仅支持内积度量,dimension/dtype使用默认值无需设置    },    fields_schema={        'author': str,    })assert ret
复制代码


说明


多向量不支持仅有 1 条稠密向量+1 条稀疏向量 collection 的建立,如有此需求,请创建单向量 Collection,度量方式选内积。

用户头像

DashVector

关注

还未添加个人签名 2024-05-14 加入

向量检索服务DashVector基于通义实验室自研的高效向量引擎Proxima内核,提供具备水平拓展能力的云原生、全托管的向量检索服务。

评论

发布
暂无评论
如何通过Python SDK创建一个新的Collection_数据库_DashVector_InfoQ写作社区