技术

在 AI Agent 基础设施领域保持领先

以更低成本构建更快、更可靠的 GenAI 应用

如果您曾好奇公司是如何构建 AI Agent 和 Agentic 系统的——不必再寻找了。在这里，我们将深入剖析 AI Agent 的方方面面，以及如何将其用于您的应用。

免费试用

联系销售

Agent 如何工作

设定目标

AI Agent 编排

AI Agent 从人类用户或其他程序获取指令。设定目标后，它们决定要采取哪些步骤（例如调用工具或数据库）。LangGraph 或 AutoGen 等工具可用于创建和调用 Agent，这些 Agent 抽象了较低级别的细节。或者您也可以编写自己的代码来设置 Agent，并将它们与完成任务所需的数据连接和工具连接起来。

查看我们的集成

AI Agent 编排

采取行动

AI 模型

Agent 通常会根据任务调用多个模型。为了优化速度和成本，您可以在简单任务中使用更小、更快的模型，并在必要时使用更高级的模型。

语义缓存

为了加快响应速度并节省 AI 推理成本，AI 应用和 Agent 可以使用语义缓存存储 LLM 的结果，以便轻松访问。这有助于处理冗余调用的用例，例如客户支持 Agent，许多用户会问诸如“如何重置我的密码？”之类的类似问题。

工具调用

Agent 可以与多个工具交互，并决定哪个工具最适合特定任务。它们可以搜索互联网、调用其他内部工具，或者编写查询以在数据库中搜索特定信息。

工具调用

语义缓存

AI 模型

获取信息

Agent 记忆（短期和长期）

在完成任务时，Agent 会在任务期间存储短期信息（如用户输入和工具调用结果），以便快速检索并可供后续步骤利用。长期记忆存储可跨多个任务、会话或交互保留和重用的持久信息。这种记忆随着时间的推移积累和保留知识。这有助于跨会话保持对用户偏好、过去查询或不断变化的目标的一致理解。

数据源

为了与现有信息交互，AI Agent 连接到一个或多个数据库以获取做出决策和提供准确响应所需的信息。就像任何其他应用一样，Agent 通过 API 执行此操作。可以训练它们智能地与 API 交互以获取所需的数据，这可能包括生成查询。Redis 通过 Redis Data Integration 很好地实现了这一点。

了解 RDI

嵌入模型

识别相关信息的一种常见技术是检索增强生成 (Retrieval Augmented Generation)，简称 RAG。对于 RAG，结构化和非结构化数据被转换为向量嵌入，该嵌入捕获数据的语义含义并返回给 Agent。

向量数据库

可用知识库或上下文的向量嵌入存储在支持向量和向量搜索的数据库中，许多数据库最近增加了对此功能的支持，因为它对 GenAI 非常有用。

查看我们的基准测试

Agent 记忆（短期和长期）