dot 速度的未来即将在您所在的城市举办活动。

加入我们在 Redis 发布会

在 Google Cloud 上使用 Redis Enterprise 构建特征存储

每天都有越来越多的公司使用 Redis 和 Redis Enterprise 构建 机器学习 (ML) 特征存储 作为 在线特征存储。在之前的博文中,我们分享了用例和 基准测试,说明了 Redis Enterprise 如何成为高吞吐量、低延迟或实时用例中性能最高且最具成本效益的在线特征存储。 

我们还分享了使用流行的开源特征存储 Feast 在 Google Colab 上本地运行 Redis 的教程,以及在 Azure 上运行 Redis 的教程——包括使用企业级 Redis,这要归功于 Azure Cache for Redis 的企业级层。此外,我们还解释了为什么 Redis OSS 或 AWS Elasticache 通常不够用,以及为什么那些正在超越其 OSS 或 ElastiCache 实现的公司正在 升级到 AWS 上的 Redis Enterprise。  


在这篇博文中,我们重点介绍了为什么像 Feast 联合创始人 Gojek 这样的领先公司正在迁移到 Google Cloud 上的 Redis Enterprise。我们还分享了一个快速入门教程,介绍如何在 Google Cloud Platform (GCP) 上运行 Redis Enterprise 和 Feast。

diagram displaying feature store with google colab using redis enterprise

在 Google Cloud Platform 上将 Redis Enterprise 用作在线特征存储

如果您已经熟悉 GCP,那么 Google Cloud 上的 Redis Enterprise 可能是您的最佳选择。它不仅是 GCP 上在线特征存储中性能最高的数据库(例如,请参阅 Feast 执行的 基准测试,该测试比较了 Google Cloud Datastore 和 Redis),而且还为您提供了在线特征存储的完全托管选项,从而简化了 Redis Cluster 的管理和扩展——这是 Redis Enterprise 比 Redis OSS 的主要优势。除了高性能和易于管理之外,Google Cloud 上的 Redis Enterprise 还提供线性可扩展性和五九 (99.999% SLA) 可用性,确保在线特征存储在规模上具有成本效益,并且不会出现停机时间。

Gojek 将其在线特征存储升级到 Redis Enterprise

由于这些原因,像印度尼西亚叫车服务 Gojek 这样的领先公司已经从 Redis OSS 升级到 Google Cloud 上的 Redis Enterprise。从那时起,Gojek 已扩展到众多新国家,转型为提供 20 多项服务的“超级应用程序”,包括电子钱包服务、外卖、快递服务等。它已成为最成功和增长最快的科技公司之一,估值超过 100 亿美元,其 ML 平台为其许多用例提供支持。  

Gojek 也是 开源特征存储 Feast 的联合创始人(与 Google Cloud 合作),该存储于 2019 年 1 月推出,使用 Redis OSS 作为其在线特征存储。 

Feast 是 Linux 基金会 AI 和数据基金会 的一部分。Feast 可以从低延迟在线存储或离线存储中提供特征,同时还提供中央注册表、存储和提供服务。这使 ML 工程师和数据科学家能够发现与 ML 用例相关的特征,并在生产环境中提供这些特征。 

如今,Feast 已成为最受欢迎的开源特征存储。它与 Redis 一起部署作为其在线存储,部署在领先公司,例如在线抵押公司 Better.com、美国金融服务公司 Robinhood、印度 B2B 批发零售平台 Udaan、数字咨询公司 Publicis Sapient 等等——当然还有 Gojek 本身。(有关 Feast 及其组件的更多详细信息,请查看这篇 带有 Redis 的 Feast 概述,以及 Feast.dev 上的 Feast 文档。) 

自 Feast 推出以来,Gojek 及其特征存储在规模和用例数量方面都有了显著增长,以至于该公司已超出其 Redis OSS 实现的容量,并转而使用 Google Cloud 上的 Redis Enterprise。Gojek 现在可以享受 Redis OSS 的所有优点以及 Redis Enterprise 的优势:完全托管的集群、五九可用性、线性可扩展性以及其他 Redis Enterprise 功能,例如 Redis 模块 和企业级安全。

使用 Feast 在 Google Cloud 上开始使用 Redis Enterprise

现在,简要概述一下在 Google Cloud 上使用开源 Feast 运行 Redis Enterprise 的快速入门教程。详细说明可在教程本身中找到,位于 Google Colab 上。 

本教程提供了分步指南,指导您在 GCP 上使用 Feast 与 Redis Enterprise 作为其在线特征存储进行 ML。它基于 Feast 快速入门教程,但没有使用默认的在线存储,而是使用 Redis Enterprise 作为其在线存储,以便大规模提供实时预测。如果您不熟悉 Feast 或 Google Cloud 上的 Redis Enterprise,那么最快的入门方法是学习这个有用的教程。

在本教程中,您将

  1. 在 Google Colab 中部署一个特征存储,该存储具有一个 Parquet 文件离线存储和 Google Cloud 上的 Redis Enterprise 作为其在线存储。
  2. 使用来自 Parquet 文件的演示时间序列特征构建一个训练数据集。
  3. 将离线存储中的特征值物化(加载)到 Redis Enterprise 在线存储中。
  4. 从 Redis Enterprise 在线存储中读取最新特征以进行推断。

您可以通过按照 Colab 笔记本 中描述的步骤,在 Google Colab 上运行本教程。

运行本教程的先决条件

要运行本教程,您需要从 Google Cloud Marketplace 获取一个 Redis Enterprise 数据库实例。如果您没有通过 Google Cloud Marketplace 获取现有的 Redis Enterprise 订阅,您可以申请您的免费 Google Cloud Marketplace $400 积分

教程场景和步骤

在本教程中,我们使用特征存储来生成训练数据,并为拼车司机满意度预测模型提供在线模型推断能力。在演示数据场景中,我们调查了一些司机,以确定他们对使用拼车应用程序的体验的满意度。目标是为其余用户生成司机满意度预测,以便我们可以联系到可能不满意的用户。

教程步骤

  1. 安装 Feast 并验证 Google Cloud Marketplace 中的 Redis Enterprise 数据库。
  2. 创建一个特征存储库,并将 Redis 配置为在线存储。
  3. 注册特征定义并部署您的特征存储。 
  4. 生成训练数据。
  5. 将特征加载到您的 Redis 在线存储中。
  6. 从 Redis 在线存储中获取用于推断的特征向量。

下一步是什么?

在这篇博文和随附的 Colab 教程中,我们向您介绍了 Redis Enterprise 作为 Google Cloud 上的在线特征存储。我们简要介绍了流行的开源特征存储 Feast,以及如何将 Google Cloud 上的 Redis Enterprise 设置为 Feast 的在线存储的分步教程。要了解有关 Redis Enterprise 的更多信息,请查看 Redis.com 的资源部分以获取更多博文、电子书、网络研讨会等。

体验 Redis Enterprise 作为您 Feast 部署的在线特征存储的速度和可扩展性!