SpringAI 版本更新:向量数据库不可用的解决方案!

Spring AI 前两天(4.10 日)更新了 1.0.0-M7 版本后,原来的 SimpleVectorStore 内存级别的向量数据库就不能用了,Spring AI 将其全部源码删除了。
此时我们就需要一种成本更低的解决方案来解决这个问题,如何解决呢?我们一起来看。
解决方案:Redis 向量数据库
虽然 SimpleVectorStore 不支持了,但 Spring AI 内置了 Redis 或 ES 作为向量数据库的分布式存储中间件,我们可以用他们来进行向量的存储。
而在这两种方案中,显然 Redis 使用成本更低,因此,我们来看如何将向量存储到 Redis 数据库中。
它的具体实现步骤如下。
安装 Redis-Stack
下载 Docker Hub:https://www.docker.com/get-started/
安装 redis-stack-server:使用“docker run -d --name redis-stack-server -p 6379:6379 redis/redis-stack-server”。
添加依赖
我们使用阿里云百炼平台的嵌入模型 text-embedding-v3 是兼容 OpenAI 的 SDK 的,因此,我们需要添加 OpenAI 和 Redis Vector 依赖:
设置配置信息
配置 Redis 连接信息,以及嵌入模型的配置信息:
阿里云百炼平台支持的向量模型:

代码实现
Redis 添加向量数据
当然,向量数据的数据源可以是文件、图片、音频等资源,这里为了简单演示整体执行流程,使用了更简单直观的文本作为数据源。
VectorStore 提供的常用方法如下:
add(List<Document> documents) :添加文档。
delete(List<String> idList) :按 ID 删除文档。
delete(Filter.Expression filterExpression) :按过滤表达式删除文档。
similaritySearch(String query) 和 similaritySearch(SearchRequest request) :相似性搜索。
执行结果如下:

查询向量数据
执行结果如下:

从上述结果可以看出,和“java”相似度最高的向量为“I love Java”,相似度评分为 0.77,如果我们 SearchRequest 对象中的 topK 设置为 1 的话,只会查询“I love Java”这条数据,如下图所示:

本文已收录到我的技术小站 www.javacn.site,其中包含的内容有:Spring AI、并发编程、MySQL、Redis、Spring、Spring MVC、Spring Boot、Spring Cloud、MyBatis、JVM、设计模式、消息队列、场景题等模块。
评论