SpringAI更新:向量数据库不可用的解决方案!

Spring AI 前两天(4.10 日)更新了 1.0.0-M7 版本后,原来的 SimpleVectorStore 内存级别的向量数据库就不能用了,Spring AI 将其全部源码删除了。

此时我们就需要一种成本更低的解决方案来解决这个问题,如何解决呢?我们一起来看。

解决方案:Redis 向量数据库

虽然 SimpleVectorStore 不支持了,但 Spring AI 内置了 Redis 或 ES 作为向量数据库的分布式存储中间件,我们可以用他们来进行向量的存储。

而在这两种方案中,显然 Redis 使用成本更低,因此,我们来看如何将向量存储到 Redis 数据库中。

它的具体实现步骤如下。

安装Redis-Stack

下载 Docker Hub:https://www.docker.com/get-started/

图片

安装 redis-stack-server:使用“docker run -d --name redis-stack-server -p 6379:6379 redis/redis-stack-server”。

添加依赖

我们使用阿里云百炼平台的嵌入模型 text-embedding-v3 是兼容 OpenAI 的 SDK 的,因此,我们需要添加 OpenAI 和 Redis Vector 依赖:

复制
<dependency> <groupId>org.springframework.ai</groupId> <artifactId>spring-ai-starter-vector-store-redis</artifactId> </dependency> <dependency> <groupId>org.springframework.ai</groupId> <artifactId>spring-ai-starter-model-openai</artifactId> </dependency>1.2.3.4.5.6.7.8.9.

设置配置信息

配置 Redis 连接信息,以及嵌入模型的配置信息:

复制
spring: data: redis: host: localhost port: 6379 ai: vectorstore: redis: initialize-schema: true index-name: custom-index prefix: custom-prefix openai: api-key: ${ALIYUN-AK} embedding: options: model: text-embedding-v31.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.

阿里云百炼平台支持的向量模型:

图片

代码实现

Redis 添加向量数据

复制
@Autowired private VectorStore vectorStore; // 构建数据 List<Document> documents = List.of(new Document("I like Spring Boot"), new Document("I love Java")); // 添加到向量数据库 vectorStore.add(documents);1.2.3.4.5.6.7.8.9.

当然,向量数据的数据源可以是文件、图片、音频等资源,这里为了简单演示整体执行流程,使用了更简单直观的文本作为数据源。

VectorStore 提供的常用方法如下:

add(Listdocuments):添加文档。delete(ListidList):按 ID 删除文档。delete(Filter.Expression filterExpression):按过滤表达式删除文档。similaritySearch(String query) 和 similaritySearch(SearchRequest request):相似性搜索。

执行结果如下:

图片

查询向量数据

复制
@RestController @RequestMapping("/vector") public class VectorController { @Resource private VectorStore vectorStore; @RequestMapping("/find") public List find(@RequestParam String query) { // 构建搜索请求,设置查询文本和返回的文档数量 SearchRequest request = SearchRequest.builder() .query(query) .topK(3) .build(); List<Document> result = vectorStore.similaritySearch(request); System.out.println(result); return result; } }1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.

执行结果如下:

图片

从上述结果可以看出,和“java”相似度最高的向量为“I love Java”,相似度评分为 0.77,如果我们 SearchRequest 对象中的 topK 设置为 1 的话,只会查询“I love Java”这条数据,如下图所示:

图片

阅读剩余
THE END