近期推出的LangChain 模板为开发者创建和部署生成式 AI API 引入了一种变革性的方法。LangChain 模板,包括新的 Redis 检索增强生成 (RAG) 模板,提供了可部署的参考架构,这些架构融合了效率和适应性。
如今,AI 开发者面临着模型提供商、数据库以及 LangChain 等开发框架之间的海量技术选择。此外,要实现生产部署,除了 Jupyter notebook 和漂亮的 Streamlit 演示之外,还需要大量投入。
为了减少 API 部署的阻力,LangChain 提供了一个可部署架构中心。这些模板涵盖了特定工具的链、大型语言模型 (LLM) 特定的链以及特定技术的链,确保了全面的开发者选项。其部署核心是LangServe,它使用FastAPI将基于 LLM 的链或代理转换为可操作的 REST API,提高了可访问性和生产就绪性。
Redis 与 LangChain 合作开发了Redis RAG 模板,这是一个经过优化的软件包,用于创建事实一致、由 LLM 驱动的聊天应用。通过使用 Redis 作为向量数据库,此模板确保了快速的上下文检索和可靠的提示构建,这对于响应迅速且精确的 AI 回复至关重要。
Redis RAG 模板为开发者提供了一个 REST API,用于与公共财务 PDF 文档(例如 Nike 的 10k 文件)进行聊天。该应用使用了
要使用该模板运行 RAG 应用,您需要两样东西
一如既往,请查阅官方项目 README 以获取最新详情。以下是使用该模板在本地构建的分步指南
1. 环境设置:设置您的 OpenAI API 密钥和 Redis 环境变量
export OPENAI_API_KEY>
export REDIS_HOST>
export REDIS_PORT>
export REDIS_USER>
export REDIS_PASSWORD>
或者,您可以设置 REDIS_URL 环境变量,而不是单独设置各个组件。
2. 创建并激活 Python3.9 虚拟环境(最佳实践)。我们将使用venv
python3.9 -m venv lc-template
source lc-template/bin/activate
3. 安装 LangChain CLI 和 Pydantic
pip install -U langchain-cli pydantic==1.10.13
3. 创建一个新的 LangChain 项目
langchain app new test-rag --package rag-redis>
运行上面显示的 LangChain CLI 命令将创建一个名为 test-rag 的新目录。
当提示安装模板时,选择 yes 选项,即 y。此步骤会将 rag-redis 模板内容下载到 ./test-rag/packages 目录下,并尝试安装 Python 依赖项。
4. 进入新项目目录
cd test-rag
查看目录树,您应该看到以下结构
5. 要使用 rag-redis 包,请在 app/server.py 文件中添加以下代码片段
from rag_redis.chain import chain as rag_redis_chain
add_routes(app, rag_redis_chain, path="/rag-redis")
6. 为演示应用摄取源数据
cd packages/rag-redis
python ingest.py
这可能需要几分钟。ingest.py 脚本执行一个管道,如下图所示,该管道加载源 PDF 文档,将文本转换为更小的块,使用HuggingFace句子转换器模型创建文本嵌入,并将数据加载到 Redis 中。
7. 使用 LangServe提供 FastAPI 应用
cd ../ && cd ../
langchain serve
8. 访问端口 8000 上的 API。启动后,您应该看到以下输出
导航到http://127.0.0.1:8000/docs以查看文档。
访问http://127.0.0.1:8000/rag-redis/playground以使用如下所示的测试操场
使用操场通过提问来测试您的 API。LangChain 应用会回复一个答案,该答案结合了从 Redis 中检索到的 Nike 公司 PDF 的丰富上下文与 OpenAI LLM 的生成能力。
我们与 LangChain 的持续合作反映了对 AI 持续创新的承诺。这种合作促进了LangChain RAG 模板等工具的开发,并支持OpenGPTs 项目等倡议。此次合作也推动了我们维护Redis <> LangChain 集成的工作,以及 Redis 自己的 AI 原生客户端redisvl。
Redis 致力于为 AI 开发者提供最新资源,以创建高性能且可用于生产的应用。
由 Redis 向量数据库提供支持的 LangChain RAG 模板简化了 AI 应用的创建。使用此模板并利用这些工具来创建推动该领域进步的 AI 解决方案。