写点什么

大模型的“海马体”来了!腾讯云 AI 原生向量数据库正式上线公测

作者:Geek_2d6073
  • 2023-08-01
    湖北
  • 本文字数:586 字

    阅读完需:约 2 分钟

8 月 1 日,腾讯云向量数据库(Tencent Cloud Vector DB)已正式上线公测。在腾讯云官网上搜索“向量数据库”,就可以正式体验该产品。


腾讯云向量数据库不仅能为大模型提供外部知识库,提高大模型回答的准确性,还可广泛应用于推荐系统、文本图像检索、自然语言处理等 AI 领域。腾讯云向量数据库是国内首个从接入层、计算层、到存储层提供全生命周期 AI 化的向量数据库。


作为一款全托管的自研企业级分布式数据库服务,腾讯云向量数据库专用于存储、检索、分析多维向量数据。该数据库支持多种索引类型和相似度计算方法,单索引支持 10 亿级向量规模,可支持百万级 QPS 及毫秒级查询延迟。



向量数据库通过把数据向量化然后进行存储和查询,可以极大地提升效率和降低成本。它能解决大模型预训练成本高、没有“长期记忆”、知识更新不足、提示词工程复杂等问题,突破大模型在时间和空间上的限制,加速大模型落地行业场景。


统计显示,将腾讯云向量数据库用于大模型预训练数据的分类、去重和清洗相比传统方式可以实现 10 倍效率的提升,如果将向量数据库作为外部知识库用于模型推理,则可以将成本降低 2-4 个数量级。


企业原先接入一个大模型需要花 1 个月左右时间,使用腾讯云向量数据库后,3 天时间即可完成,极大降低了企业的接入成本。


据了解,腾讯云向量数据库的向量化能力(embedding)曾多次获得权威机构认可,2021 年曾登顶 MS MARCO 榜单第一、相关成果已发表于 NLP 顶会 EMNLP。

用户头像

Geek_2d6073

关注

还未添加个人签名 2021-12-22 加入

还未添加个人简介

评论

发布
暂无评论
大模型的“海马体”来了!腾讯云AI 原生向量数据库正式上线公测_Geek_2d6073_InfoQ写作社区