dot Redis 8 来了——而且它是开源的

了解更多

隆重推出 LangCache 和 vector sets,为高性能 AI 应用提供的简单解决方案

今天,我们宣布为 AI 开发者推出两项新产品,帮助他们构建更好的应用程序。Redis LangCache 是一项全新的、完全托管的 AI 应用程序和代理语义缓存服务,它通过 API 连接提供托管的语义缓存,使 AI 应用程序更快、更准确。Vector sets 是 Redis 的一种新的原生数据类型,它允许开发者轻松访问和使用向量,并以更具组合性和可扩展性的方式使用它们。两者都为开发者提供了一种更简单的方式来处理构建代理应用程序所需的复杂数据。

这两项功能,以及许多其他新工具、特性、升级和集成,共同为开发者构建更快、更准确的 GenAI 应用程序和代理提供了全面的实时数据架构。我们迫不及待地想看到你们开始使用。

LangCache:Redis 驱动的完全托管语义缓存

LangCache,我们新的语义缓存托管服务,现已提供私有预览。通过 LangCache,您可以将 LLM 响应缓存无缝集成到您的应用程序中。它具有 REST API 接口,实现起来毫不费力,并包含高级优化,以确保高度准确的缓存性能。语义缓存对于 GenAI 应用程序至关重要,因为它显著降低了响应延迟并提高了成本效率,同时保持了高质量的用户交互。

LangCache 让您能够

  • 接收用户查询并返回先前存储的相关提示,从而节省昂贵的 LLM 调用,并加速 GenAI 应用程序。
  • 使用我们的自定义微调模型和可配置的搜索标准(包括搜索算法和阈值距离)提高 LLM 缓存检索的准确性。
  • 通过您选择的模型提供商生成嵌入。无需再单独管理模型、API 密钥和特定于模型的变量。
  • 管理响应,使应用程序仅返回经当前用户批准的数据。无需在应用程序中构建单独的安全协议。
  • 使用我们的完全托管服务更快地构建 GenAI 应用程序。您不再需要自己设置和管理向量数据库以及缓存失效。

在此处注册私有预览。

隆重推出 vector sets,一种用于向量相似性的新原生数据类型

Vector sets 是一种突破性的原生数据类型,允许开发者轻松访问和使用向量。Vector sets 由 Redis 的原始创建者 Salvatore Sanfilippo 开发。它们借鉴了 Sorted sets 的灵感,并扩展了这一概念来存储和查询向量嵌入,以实现语义搜索数据。像 Sorted sets 一样,Vector sets 具有字符串元素,但现在它们与向量相关联,而不是分数。Vector sets 的基本目标是能够添加项目,然后获取与指定向量最相似的已添加项目的子集。我们很高兴看到你们用它构建什么。它们现在已在 Redis 8 中推出 Beta 版。在此处了解有关 Vector sets 及其使用方法的更多信息。

向量搜索正在以更多方式改进。我们正在推出混合搜索,它结合了全文搜索和向量相似性搜索。通过组合不同的查询类型,混合搜索可为您的应用程序提供更相关的结果。您可以在此处使用新的 RedisVL 0.5.1 自行实现

现在,Redis 将提供量化并支持 int8 作为更节省内存的向量类型。以前,Redis 支持 float64、float32、float16 和 bfloat16。量化将浮点嵌入压缩为 8 位整数,使 int8 嵌入能够减少内存使用和成本达 75%,并将搜索速度提高 30%,同时保持原始搜索准确度的 99.99%。

通过 LangGraph 集成和代理内存,构建更智能的 AI 代理

我们正在通过一系列LangGraph 原生集成扩展我们的 GenAI 生态系统,这些集成专为代理架构和代理应用程序设计。通过将 Redis 与 LangGraph 的内存架构集成,LangGraph 代理可以利用 Redis 作为快速而全面的数据层,从而提供开箱即用的无与伦比的速度。对于构建 LangGraph 代理的短期内存(通过 checkpointers)、长期内存(通过 Store)、向量数据库、LLM 缓存和速率限制,Redis 是您所需的全部。

我们还发布了Redis Agent Memory Server。它是我们的开源服务,为 AI 应用程序和代理提供内存管理。用户可以管理 AI 对话的短期和长期内存,功能包括自动主题提取、实体识别和上下文摘要。

这建立在我们与LangChainLlamaIndexLiteLLMMem0Haystack 等 GenAI 集成合作伙伴关系的现有组合之上,这些合作伙伴关系都建立在将 Redis 用作高性能向量数据库和 LLM 缓存的基础上。在构建代理应用程序时加快您的开发速度,同时确保您的应用程序实现实时性能。

为了使用代理和 Redis Cloud 更快地进行构建,我们发布了Redis Cloud Admin API MCP Server。它是一个自然语言的 Redis Cloud 管理员,您可以询问有关您的订阅的问题并采取行动,例如在订阅下部署新的数据库。此 MCP 服务器可以与 MCP 兼容的客户端应用程序集成,例如 Claude Desktop 或 Cursor。

在此处了解如何获得最佳缓存和 AI 功能的更多信息。

Redis Cloud:更快地启动和交付实时 GenAI

随着 GenAI 带来不同数据类型的激增,开发者需要一个平台,无论您需要在哪里,都能快速处理这一切:多云或混合云、大规模,以及最高效率,以实现优化的总体拥有成本。

我们正在通过 Redis Cloud 上的新工具和功能(包括 Redis Data Integration、Redis Flex 和 Redis Insight)为您提供所有这些功能。

Cloud Pro 上的 Redis Data Integration

您现在可以获得 Cloud Pro 上 Redis Data Integration (RDI) 的私有预览访问权限——这是我们的变更数据捕获产品——它可以轻松自动地在您的缓存和数据库之间同步数据。数据库中的每个更新都是一个事件,通过 RDI 管道推送到您的缓存,从而在几毫秒内实现数据一致性。而且您无需担心这会给您需要构建、测试和维护的系统带来额外的复杂性,因为它由我们官方支持。

Cloud Essentials 上的 Redis Flex

Cloud Essentials 上的 Redis Flex 的公共预览访问权限现已开放。Redis Flex 是 Redis 的重构版本,原生跨越 RAM 和 SSD,从第一个字节到最大的数据集都能提供最快的速度。通过 Redis Flex,您可以以与以前相同的价格在应用程序和数据库中存储多达五倍的数据。想象一下,您的应用程序现在可以对过去 15 个月的数据进行缓存命中,而不仅仅是对过去 3 个月的数据进行缓存命中。或者,不再只有过去一周的数据是快速的,而是有过去五周的数据是实时的。缓存命中率的提高减少了延迟,从而创造了更好、更快的应用程序体验。

云上的 Redis Insight

您可以使用云上的 Redis Insight(公共预览版)直接从浏览器查看、更新、查询和搜索 Redis 数据库中的数据。Web 版本包含 Insight 桌面版本(我们的官方 Redis 开发环境)中的许多最常用功能,包括 Workbench 和教程。Web 和桌面版本的新功能是查询自动补全,它可以实时动态提取和建议 Redis 数据中的模式、索引和键名称,以便您更快、更轻松地编写查询。云上的 Redis Insight 现已在部分区域提供,并将在今年逐步推广到更多区域。

最后,我们现在可以让您“自带云”并在您自己的虚拟私有云中、您选择的 AWS 环境中运行 Redis Cloud,同时仍然获得 Redis 团队的支持和专业知识。

在此处通过免费试用开始使用 Redis Cloud 的所有这些新功能,或联系您的客户经理。

Redis 8 发布候选版现已推出

我们还发布了 Redis 8 的发布候选版供下载。它是目前最快的 Redis 版本,具有三十多项性能改进,支持八种新的数据结构,Redis 查询引擎处理能力提高 16 倍,以及更可靠的复制。您可以在此处下载发布候选版。

Redis 8 将在未来几周内正式发布。
在此处redis.io/new 了解更多关于春季发布的信息,或收听我们下周(2025 年 4 月 16 日)的网络研讨会,其中包含开发者实时问答。