Agentic RAG
了解 LlamaIndex 用于构建 Agentic RAG 客户支持系统的架构和组件。包含代码片段和 Notebook。
AI Agent 编排
AI Agent 从人类用户或其他程序获取指令。设定目标后,它们决定要采取哪些步骤(例如调用工具或数据库)。LangGraph 或 AutoGen 等工具可用于创建和调用 Agent,这些 Agent 抽象了较低级别的细节。或者您也可以编写自己的代码来设置 Agent,并将它们与完成任务所需的数据连接和工具连接起来。
AI Agent 编排
AI 模型
Agent 通常会根据任务调用多个模型。为了优化速度和成本,您可以在简单任务中使用更小、更快的模型,并在必要时使用更高级的模型。
语义缓存
为了加快响应速度并节省 AI 推理成本,AI 应用和 Agent 可以使用语义缓存存储 LLM 的结果,以便轻松访问。这有助于处理冗余调用的用例,例如客户支持 Agent,许多用户会问诸如“如何重置我的密码?”之类的类似问题。
工具调用
Agent 可以与多个工具交互,并决定哪个工具最适合特定任务。它们可以搜索互联网、调用其他内部工具,或者编写查询以在数据库中搜索特定信息。
工具调用
语义缓存
AI 模型
Agent 记忆(短期和长期)
在完成任务时,Agent 会在任务期间存储短期信息(如用户输入和工具调用结果),以便快速检索并可供后续步骤利用。长期记忆存储可跨多个任务、会话或交互保留和重用的持久信息。这种记忆随着时间的推移积累和保留知识。这有助于跨会话保持对用户偏好、过去查询或不断变化的目标的一致理解。
数据源
为了与现有信息交互,AI Agent 连接到一个或多个数据库以获取做出决策和提供准确响应所需的信息。就像任何其他应用一样,Agent 通过 API 执行此操作。可以训练它们智能地与 API 交互以获取所需的数据,这可能包括生成查询。Redis 通过 Redis Data Integration 很好地实现了这一点。
嵌入模型
识别相关信息的一种常见技术是检索增强生成 (Retrieval Augmented Generation),简称 RAG。对于 RAG,结构化和非结构化数据被转换为向量嵌入,该嵌入捕获数据的语义含义并返回给 Agent。
向量数据库
可用知识库或上下文的向量嵌入存储在支持向量和向量搜索的数据库中,许多数据库最近增加了对此功能的支持,因为它对 GenAI 非常有用。
Agent 记忆(短期和长期)
数据源
嵌入模型
向量数据库
托管 & AI 芯片
AI 应用可以使用所有主要的云服务提供商、本地解决方案和混合解决方案部署到生产环境。它们使用 GPU、TPU 和 CPU 等硬件来处理任务并满足其计算容量需求。
LLMOps、授权 & 开发工具
执行后,您将需要支持框架和平台,以确保您的数据流正常,并在出现问题时可以修复 Agent。还有 Agent 构建工具,让您可以通过少量或无需代码来设计和构建 AI Agent。在此处查看演示和资源。
托管
AI 芯片
LLMOps
授权
开发工具
考虑延迟
AI Agent 扮演着各种角色,从清洗和标注数据到为用户回答实时问题。对于与人类或流数据交互的 Agent,组件需要快速。对于后台或异步进程,较慢的响应可能没问题。但随着 Agentic 系统变得越来越复杂,延迟会累积,许多设计尝试从最初设计阶段就针对实时性进行优化,而不是稍后尝试减少延迟。
规划未来创新
GenAI 领域创新不断,您需要具有生态系统支持的工具。为了适应不断涌现的新工具、框架和模型,构建您的 Agent 架构时应利用最新的模型,或者添加新的数据源或日志记录、可见性等工具。
构建可扩展系统
您可能想构建一个原型来确立概念验证。将原型迁移到生产环境时,请确保您的 Agentic 系统能够处理混乱的生产数据,在许多用户同时使用时不会变慢,并能应对授权协议和 DDoS 攻击等安全方面的考虑。
了解如何在您的应用中使用 AI Agent 的更多信息,请联系 Redis 专家。
通过与 Redis 专家交流来处理应用。