dot Redis 8 来了——它是开源的

了解更多

技术

在 AI Agent 基础设施领域保持领先

以更低成本构建更快、更可靠的 GenAI 应用 

设定目标

AI Agent 编排

AI Agent 从人类用户或其他程序获取指令。设定目标后,它们决定要采取哪些步骤(例如调用工具或数据库)。LangGraph 或 AutoGen 等工具可用于创建和调用 Agent,这些 Agent 抽象了较低级别的细节。或者您也可以编写自己的代码来设置 Agent,并将它们与完成任务所需的数据连接和工具连接起来。

查看我们的集成

AI Agent 编排

采取行动

AI 模型

Agent 通常会根据任务调用多个模型。为了优化速度和成本,您可以在简单任务中使用更小、更快的模型,并在必要时使用更高级的模型。

语义缓存

为了加快响应速度并节省 AI 推理成本,AI 应用和 Agent 可以使用语义缓存存储 LLM 的结果,以便轻松访问。这有助于处理冗余调用的用例,例如客户支持 Agent,许多用户会问诸如“如何重置我的密码?”之类的类似问题。

阅读更多

工具调用

Agent 可以与多个工具交互,并决定哪个工具最适合特定任务。它们可以搜索互联网、调用其他内部工具,或者编写查询以在数据库中搜索特定信息。

工具调用

语义缓存

AI 模型

获取信息

Agent 记忆(短期和长期)

在完成任务时,Agent 会在任务期间存储短期信息(如用户输入和工具调用结果),以便快速检索并可供后续步骤利用。长期记忆存储可跨多个任务、会话或交互保留和重用的持久信息。这种记忆随着时间的推移积累和保留知识。这有助于跨会话保持对用户偏好、过去查询或不断变化的目标的一致理解。

阅读更多

数据源

为了与现有信息交互,AI Agent 连接到一个或多个数据库以获取做出决策和提供准确响应所需的信息。就像任何其他应用一样,Agent 通过 API 执行此操作。可以训练它们智能地与 API 交互以获取所需的数据,这可能包括生成查询。Redis 通过 Redis Data Integration 很好地实现了这一点。

了解 RDI

嵌入模型

识别相关信息的一种常见技术是检索增强生成 (Retrieval Augmented Generation),简称 RAG。对于 RAG,结构化和非结构化数据被转换为向量嵌入,该嵌入捕获数据的语义含义并返回给 Agent。

向量数据库

可用知识库或上下文的向量嵌入存储在支持向量和向量搜索的数据库中,许多数据库最近增加了对此功能的支持,因为它对 GenAI 非常有用。

查看我们的基准测试

Agent 记忆(短期和长期)

数据源

嵌入模型

向量数据库

通过基础设施扩展

托管 & AI 芯片

AI 应用可以使用所有主要的云服务提供商、本地解决方案和混合解决方案部署到生产环境。它们使用 GPU、TPU 和 CPU 等硬件来处理任务并满足其计算容量需求。

查看我们的云合作伙伴

LLMOps、授权 & 开发工具

执行后,您将需要支持框架和平台,以确保您的数据流正常,并在出现问题时可以修复 Agent。还有 Agent 构建工具,让您可以通过少量或无需代码来设计和构建 AI Agent。在此处查看演示和资源。

托管

AI 芯片

LLMOps

授权

开发工具

优化和迭代

考虑延迟

AI Agent 扮演着各种角色,从清洗和标注数据到为用户回答实时问题。对于与人类或流数据交互的 Agent,组件需要快速。对于后台或异步进程,较慢的响应可能没问题。但随着 Agentic 系统变得越来越复杂,延迟会累积,许多设计尝试从最初设计阶段就针对实时性进行优化,而不是稍后尝试减少延迟。

规划未来创新

GenAI 领域创新不断,您需要具有生态系统支持的工具。为了适应不断涌现的新工具、框架和模型,构建您的 Agent 架构时应利用最新的模型,或者添加新的数据源或日志记录、可见性等工具。

构建可扩展系统

您可能想构建一个原型来确立概念验证。将原型迁移到生产环境时,请确保您的 Agentic 系统能够处理混乱的生产数据,在许多用户同时使用时不会变慢,并能应对授权协议和 DDoS 攻击等安全方面的考虑。

查看我们的客户

基础知识

什么是 AI Agent?

它们是使用 GenAI 完成特定任务的个体执行者。它们可以决定要采取哪些步骤、调用其他工具,并在返回其输出之前评估中间步骤。

什么是 Agentic 系统?

它们由多个组件或 Agent 协作构建而成。它们不同于仅调用一次单一 AI 模型来完成整个端到端工作流程。通过结合多个 Agent 或组件,您可以获得 GenAI 的优势,同时具有更多的控制权和更好的输出。

它们如何工作?

Agent 从用户或程序接收指令以完成任务。然后,它们可以在多个工具之间进行选择以决定下一步,并在返回高质量响应之前评估结果。它们使用多个数据源来获取完成请求所需的必要信息。

我为什么要关注?

Agent 允许将任务分解为其组成部分。大型、复杂的模型在一系列测试中表现出色,但它们仍然会在重要的事情上犯错,有时还会产生幻觉。通过设计一个具有多个组件的更好系统,更容易改进某些任务,因此公司正在转向 AI Agent。

查阅这些资源

网络研讨会

Agentic RAG

了解 LlamaIndex 用于构建 Agentic RAG 客户支持系统的架构和组件。包含代码片段和 Notebook。

教程

构建 AI Agent

获取包含构建自己的 AI Agent 所需代码和说明的 Notebook,这些 Agent 可以执行各种任务、调用工具并响应用户请求。 

文档

将 Redis 集成到 AI Agent 中

了解如何在当前工作流程中使用 Redis 加速您的 AI Agent。

开始使用

了解如何在您的应用中使用 AI Agent 的更多信息,请联系 Redis 专家。
通过与 Redis 专家交流来处理应用。