写点什么

如何通过 Python SDK 向 Collection 中插入 Doc

作者:DashVector
  • 2025-09-24
    陕西
  • 本文字数:1852 字

    阅读完需:约 6 分钟

本文介绍如何通过 Python SDK 向 Collection 中插入 Doc。


说明


  1. 插入 Doc 时若指定 id 已存在,已存在的 Doc 不会被覆盖,本次插入 Doc 操作无效。

  2. 插入 Doc 时若不指定 id,则在插入过程中会自动生成 id,并在返回结果中携带 id 信息。

前提条件

  • 已创建 Cluster

  • 已获得 API-KEY

  • 已安装最新版 SDK

接口定义

Python


Collection.insert(    docs: Union[Doc, List[Doc], Tuple, List[Tuple]],    partition: Optional[str] = None,    async_req: False) -> DashVectorResponse
复制代码

使用示例

说明


  1. 需要使用您的 api-key 替换示例中的 YOUR_API_KEY、您的 Cluster Endpoint 替换示例中的 YOUR_CLUSTER_ENDPOINT,代码才能正常运行。

  2. 本示例需要参考新建Collection-使用示例的 Collection。


Python


import dashvectorfrom dashvector import Docimport numpy as np
client = dashvector.Client( api_key='YOUR_API_KEY', endpoint='YOUR_CLUSTER_ENDPOINT')collection = client.get(name='quickstart')
复制代码

插入 Doc

Python


# 通过Doc对象insertret = collection.insert(    Doc(        id='1',        vector=[0.1, 0.2, 0.3, 0.4]    ))# 判断insert是否成功assert ret
# 简化形式:通过Tuple insertret = collection.insert( ('2', [0.1, 0.1, 0.1, 0.1]) # (id, vector))
复制代码

插入不带有 Id 的 Doc

Python


# 插入Doc不携带idret = collection.insert(  Doc(vector=[0.1, 0.2, 0.3, 0.4]))
# 简化形式:通过Tuple insertret = collection.insert( ([0.1, 0.1, 0.1, 0.1],))
复制代码

插入带有 Fields 的 Doc

Python


# insert单条数据,并设置Fields Valueret = collection.insert(    Doc(        id='3',        vector=np.random.rand(4),        fields={            # 设置创建Collection时预定义的Fields Value            # name:str, weight:float, age:int, id:dashvector.long            'name': 'zhangsan', 'weight':70.0, 'age':30, 'id':1234567890,            # 设置Schema-Free的Field & Value            'anykey1': 'str-value', 'anykey2': 1,            'anykey3': True, 'anykey4': 3.1415926        }    ))
# insert单条数据,并设置Fields Valueret = collection.insert( ('4', np.random.rand(4), {'foo': 'bar'}) # (id, vector, fields))
复制代码

批量插入 Doc

Python


# 通过Doc对象,批量insert 10条数据ret = collection.insert(    [        Doc(id=str(i+5), vector=np.random.rand(4)) for i in range(10)    ])
# 简化形式:通过Tuple,批量insert 3条数据ret = collection.insert( [ ('15', [0.2,0.7,0.8,1.3], {'age': 20}), ('16', [0.3,0.6,0.9,1.2], {'age': 30}), ('17', [0.4,0.5,1.0,1.1], {'age': 40}) ] # List[(id, vector, fields)])
# 判断批量insert是否成功assert ret
复制代码

异步插入 Doc

Python


# 异步批量insert 10条数据ret_funture = collection.insert(    [        Doc(id=str(i+18), vector=np.random.rand(4), fields={'name': 'foo' + str(i)}) for i in range(10)    ],    async_req=True)# 等待并获取异步insert结果ret = ret_funture.get()
复制代码

插入带有 Sparse Vector 的 Doc

Python


ret = collection.insert(    Doc(        id='28',        vector=[0.1, 0.2, 0.3, 0.4],        sparse_vector={1:0.4, 10000:0.6, 222222:0.8}    ))
复制代码

插入多向量的 Doc

Python


collection = client.get(name='multi_vector_demo')docs = []docs.append(Doc(id='1', vectors={"title": [0.3, 0.4, 0.5, 0.6], "content": [0.3, 0.4, 0.5, 0.6, 0.7, 0.8]}))docs.append(Doc(id='2', vectors={"title": [0.3, 0.4, 0.5, 0.6]}, fields={'author':'zhangsan'}))docs.append(Doc(id='3', vectors={"content": [0.1, 0.2, 0.3, 0.4, 0.5, 0.6]}, fields={'anykey':'anyvalue'}))docs.append(Doc(id='4', vectors={"title": [0.3, 0.4, 0.5, 0.6], "content": [0.3, 0.4, 0.5, 0.6, 0.7, 0.8]}, sparse_vectors={"abstruct": {0: 0.1, 1: 0.32, 2: 0.482}}))docs.append(Doc(id='5', sparse_vectors={"abstruct": {0: 0.3, 1: 0.232, 2: 0.4482, 3: 0.6672}}, fields={'author':'lisi'}))ret = collection.insert(docs)print(ret)
复制代码


说明


多向量 Collection 中,稠密向量+稀疏向量字段总共不能超过 4 条


点击了解更多关于向量检索服务 DashVector信息,可进行免费试用~

用户头像

DashVector

关注

还未添加个人签名 2024-05-14 加入

向量检索服务DashVector基于通义实验室自研的高效向量引擎Proxima内核,提供具备水平拓展能力的云原生、全托管的向量检索服务。

评论

发布
暂无评论
如何通过Python SDK 向 Collection 中插入 Doc_人工智能_DashVector_InfoQ写作社区