写点什么

快速理解向量和向量数据库

  • 2025-07-01
    福建
  • 本文字数:1056 字

    阅读完需:约 3 分钟

1. 什么是向量,向量的本质是什么?


想象你走进一家咖啡店,想点一杯咖啡。咖啡的口味、价格、甜度就是一些 “属性”。如果把这些属性用数字表示,比如美式咖啡(苦味 8 分,价格 25 元,甜度 0 分),这组数字[8,25,0]就组成了一个 “向量”。简单来说,向量就是一组有序的数字,它能用来描述事物的特征。​在 AI 世界里,向量的本质是将复杂信息转化为计算机能理解的数学语言。比如一段文字、一张图片,都能通过特定算法变成向量,让计算机进行计算和比较。


2. 向量数据库中的维度是什么?


接着上面咖啡的例子,“苦味、价格、甜度” 这三个属性,就是向量的维度。维度就像是描述事物的 “角度”,维度越多,例如再加上“香味,颜色”等维度,对咖啡的描述就更细致。维度越多,对事物的描述就越细致。



在 AI 领域,一个图像向量可能有上千个维度,分别记录图像某个区域的颜色、纹理等信息;一段文本的向量维度,可能反映词语的语义、情感倾向等。维度数量决定了向量包含信息的丰富程度,但维度过高也会增加计算的复杂性。


3. 什么是向量数据库?


传统数据库(如 MySQL)擅长存储结构化数据,比如学生成绩表、商品清单。而向量数据库专门用来存储、管理和查询向量数据。它就像一个巨大的 “数字图书馆”,里面存放的不是书籍,而是各种用向量表示的信息,比如图片、文章、语音等。​向量数据库不仅能存向量,最关键的是具备强大的相似性搜索能力。比如你存入一张猫的图片向量,它能快速找出数据库里所有和这只猫 “长得像” 的图片向量,这是传统数据库很难做到的。


4. 什么时候可以考虑用向量数据库?


  • 非结构化数据分析:数据是文本、图像、音频等非结构化数据,需要转化为向量进行分析。​

  • 相似性搜索,比如找相似的商品、内容推荐、重复检测等,需要将被搜索的事务数据先转化为向量。


5. 向量数据库的典型应用场景?


  • 个性化推荐:在电商平台,根据用户的浏览记录、购买行为向量,推荐相似的商品;在音乐 APP 里,它能找到和你喜欢的歌曲风格相似的音乐。​

  • 语义搜索:输入一段描述,向量数据库可以找到语义相近的文章、视频,比传统关键词搜索更 “懂你”。​

  • 图像/ 视频搜索:安防系统中,快速比对监控画面中的人脸;短视频平台中检测重复内容。​


6. 都有哪些常用的向量数据库可以用?


  • Milvus:主要用于分布式方案,适合高并发场景,学习门槛低, Apache 2.0 许可

  • Faiss:专注于高效的向量相似性计算,适合对性能要求极高的场景。学习门槛相适中,MIT 许可


文章转载自:两棵雪松

原文链接:https://www.cnblogs.com/twosedar/p/18957931

体验地址:http://www.jnpfsoft.com/?from=001YH

用户头像

还未添加个人签名 2025-04-01 加入

还未添加个人简介

评论

发布
暂无评论
快速理解向量和向量数据库_数据库_量贩潮汐·WholesaleTide_InfoQ写作社区