Redis for AI 文档
Redis for AI 文档概述
Redis 存储并索引语义表示非结构化数据(包括文本段落、图像、视频或音频)的向量嵌入。将向量和相关元数据存储在 hashes 或 JSON 文档中,以便进行索引和查询。
向量 | RAG | RedisVL |
---|---|---|
![]() |
![]() |
![]() |
概述
本页面根据您的目标分为几个部分
- 操作指南 - 涵盖所有功能、API 和设置的综合参考部分。它是支持任何级别开发的详细技术信息来源。
- 概念 - 解释基础理念和核心原则,帮助您理解产品特性和设计背后的原因。
- 快速入门 - 简短、有重点的指南,让您在几分钟内开始使用主要功能或工作流程。
- 教程 - 深入探讨特定用例或流程的详细演练。这些分步指南帮助您掌握基本任务和工作流程。
- 集成 - 帮助您将产品与流行工具、框架或平台连接并使用的指南和资源。
- 性能基准 - 性能比较和度量指标,展示产品在各种场景下的表现。这有助于您了解其效率和能力。
- 最佳实践 - 提高效率和避免常见陷阱的建议和指南。本节旨在帮助您有效率地使用产品。
操作指南
- 创建向量索引:Redis 使用定义的 schema(包括向量字段和元数据)维护数据的二级索引。Redis 支持
FLAT
和HNSW
向量索引类型。 - 存储和更新向量:Redis 将向量和元数据存储在 hashes 或 JSON 对象中。
- 使用向量进行搜索:Redis 支持多种针对向量字段的高级查询策略,包括 k 近邻 (KNN)、向量范围查询和元数据过滤。
- 在运行时配置向量查询。选择最佳过滤模式以优化查询执行。
了解如何索引和查询向量嵌入
概念
了解如何在您的 AI/ML 项目中执行向量搜索以及使用网关和语义缓存。
搜索 | LLM 记忆 | 语义缓存 | 语义路由 | AI 网关 |
---|---|---|---|---|
![]() |
![]() |
![]() |
![]() |
![]() |
快速入门
快速入门或示例对于构建特定功能非常有用。例如,您可能想使用 LangChain 进行 RAG 或为您的 AI Agent 设置 LLM 记忆。从以下 Redis Python notebook 开始。
混合和向量搜索
向量搜索根据高维数值嵌入的相似性检索结果,而混合搜索则将其与传统的关键词或基于元数据的过滤结合起来,以获得更全面的结果。
- 使用 Redis 实现混合搜索
- 使用 Redis Python 客户端进行向量搜索
- 使用 Redis Vector Library 进行向量搜索
- 演示如何将 float 32 索引转换为 float16 或整数数据类型
RAG
检索增强生成(即 RAG)是一种增强 LLM 响应用户查询能力的技术。RAG 的检索部分由向量数据库支持,向量数据库可以返回与用户查询语义相关的结果,作为上下文信息来增强 LLM 的生成能力。
- 使用 Redis Vector Library 从头开始实现 RAG
- 使用 Redis 和 LangChain 实现 RAG
- 使用 Redis 和 LlamaIndex 实现 RAG
- 使用 redisvl 进行高级 RAG
- 使用 Redis 和 Nvidia 实现 RAG
- 利用 RAGAS 框架评估 RAG 性能
- 使用 Azure 进行向量搜索
- 使用 Spring AI 实现 RAG
- 使用 Vertex AI 实现 RAG
- 提高 RAG 质量的其他技巧和技术 Notebook
- 使用 Redis 通过向量搜索实现简单的 RBAC 策略
Agents
AI Agent 可以自主地为用户规划和执行任务。
- LangGraph 的 Redis Notebook
- LangGraph 和 Agent 快速入门 Notebook
- 使用 Redis 进行数据存储,CrewAI 进行基于 Agent 的任务执行,LangGraph 进行工作流管理,构建协作式电影推荐系统。
- 全功能 Agent 架构
LLM 记忆
LLM 是无状态的。为了在对话中保持上下文,必须存储聊天会话并重新发送给 LLM。Redis 管理聊天会话的存储和检索,以保持上下文和对话相关性。
语义缓存
估计 31% 的 LLM 查询可能是冗余的。Redis 启用语义缓存,帮助快速降低 LLM 成本。
语义路由
路由是一种简单有效的方法,可以防止 AI 应用被误用,或用于在数据源之间创建分支逻辑等。
计算机视觉
使用 Facenet embedding 模型和 RedisVL 构建人脸识别系统。
推荐系统
特征存储
教程
需要更深入地了解不同的用例和主题?
RAG
- Agentic RAG - 专注于使用 LlamaIndex 和 Amazon Bedrock 进行 Agentic RAG 的教程
- Vertex AI 上的 RAG - 介绍使用 Redis 和 Vertex AI 的 RAG 教程
- RAG 工作台 - 用于探索 Redis RAG 技术的开发环境
- ArXiv Chat - 使用 Redis 和 OpenAI 对 ArXiv 文档进行 RAG 的 Streamlit 演示
推荐和搜索
- 使用 NVIDIA Merlin 和 Redis 的推荐系统 - 三个复杂性递增的示例,展示了如何使用 NVIDIA 和 Redis 构建实时推荐系统
- Redis 产品搜索 - 使用全文搜索、向量相似性和实时数据更新等功能构建实时产品搜索引擎
- ArXiv 搜索 - 使用 React FE 的 Redis 全栈实现
生态系统集成
- LangGraph 和 Redis:构建具有记忆和持久性的更智能 AI Agent
- Amazon Bedrock 设置指南
- LangChain Redis 包:具有高级向量存储和更快缓存的更智能 AI 应用
- LlamaIndex 将 Redis 集成作为向量存储
- Redis Cloud 可在 Vercel 上使用
- 使用 Vercel 集成创建 Redis Cloud 数据库
- 使用 Redis 和 Spring AI 构建 RAG 应用
- 使用 Redis 和 NVIDIA NIM 更快地部署 GenAI 应用
- 使用 Kernel Memory 和 Redis 构建 LLM 应用
- Jina AI 实现的将 Redis 集成作为向量数据库的 DocArray
- Semantic Kernel:微软开发的一个流行库,用于将 LLM 与插件集成
- LiteLLM 集成
性能基准
看看我们与竞争对手的对比。
最佳实践
看看行业领导者是如何构建他们的 RAG 应用的。