dot Redis 8 已发布——它是开源的

了解更多

在 Google Cloud 上使用 Redis Enterprise 构建特征商店

每天,越来越多的公司正在使用 Redis 和 Redis Enterprise 作为在线特征商店,为机器学习 (ML) 构建特征商店。在之前的博客文章中,我们分享了用例和基准测试,说明了 Redis Enterprise 如何成为高吞吐量、低延迟或实时用例性能最佳且成本效益最高的在线特征商店。 

我们还分享了关于在 Google ColabAzure 上运行 Redis 与流行的开源特征商店 Feast 的本地教程——包括使用企业级 Redis,这得益于 Azure Cache for Redis 的企业层级。此外,我们还解释了为什么 Redis OSS 或 AWS Elasticache 通常不足够,以及为什么那些其 OSS 或 ElastiCache 实现已无法满足需求的的公司正在升级到 AWS 上的 Redis Enterprise。  


在这篇博客文章中,我们重点介绍为什么包括 Feast 共同创建者 Gojek 在内的领先公司正在迁移到 Google Cloud 上的 Redis Enterprise。我们还将分享一个关于如何在 Google Cloud Platform (GCP) 上使用 Feast 运行 Redis Enterprise 的快速入门教程。

diagram displaying feature store with google colab using redis enterprise

Redis Enterprise 作为 Google Cloud Platform 上的在线特征商店

如果您已经熟悉 GCP,那么 Google Cloud 上的 Redis Enterprise 可能是您的最佳选择。它不仅是 GCP 上在线特征商店性能最高的数据库(例如,参见 Feast 进行的比较 Google Cloud Datastore 和 Redis 的基准测试),它还为您的在线特征商店提供完全托管的选项,从而简化了 Redis Cluster 的管理和扩展——这是 Redis Enterprise 相较于 Redis OSS 的主要优势。除了高性能和易于管理之外,Google Cloud 上的 Redis Enterprise 还提供线性扩展能力和五个九 (99.999% SLA) 的可用性,确保在线特征商店在大规模应用场景下具有成本效益且不会发生停机。

Gojek 将其在线特征商店升级到 Redis Enterprise

出于这些原因,包括印度尼西亚网约车服务 Gojek 在内的领先公司已经从 Redis OSS 升级到 Google Cloud 上的 Redis Enterprise。此后,Gojek 已扩展到众多新国家,转型成为一个“超级应用”,提供 20 多种服务,包括电子钱包服务、外卖服务、快递服务等等。它已成为最成功且增长最快的科技公司之一,估值超过 100 亿美元,其 ML 平台为其许多用例提供支持。  

Gojek 还是(与 Google Cloud 一起)开源特征商店 Feast 的共同创建者,它于 2019 年 1 月推出,并使用 Redis OSS 作为其在线特征商店。 

Feast 是 Linux Foundation 的 AI & Data Foundation 的一部分。Feast 可以从低延迟的在线存储或离线存储提供特征,同时还提供中央注册表、存储和提供服务。这使得 ML 工程师和数据科学家能够发现与 ML 用例相关的特征,并在生产环境中提供这些特征。 

如今,Feast 已成为最受欢迎的开源特征商店。它与 Redis 一起作为其在线存储部署在许多领先公司,例如在线抵押贷款公司 Better.com、美国金融服务公司 Robinhood、印度 B2B 批发零售平台 Udaan、数字咨询公司 Publicis Sapient 等等——当然,也包括 Gojek 本身。(有关 Feast 及其组件的更多详细信息,请查看此Feast 与 Redis 概述,以及 Feast.dev 上的 Feast 文档。) 

自 Feast 推出以来,Gojek 及其特征商店在规模和用例数量方面均取得了长足发展,以至于该公司的 Redis OSS 实现已无法满足需求,因此转向了 Google Cloud 上的 Redis Enterprise。现在,Gojek 可以享受到 Redis OSS 的所有优点以及 Redis Enterprise 的优势:完全托管的集群、五个九的可用性、线性扩展能力以及其他 Redis Enterprise 特性,如 Redis 模块和企业级安全性。

在 Google Cloud 上使用 Feast 开始使用 Redis Enterprise

现在,简要概述一下关于在 Google Cloud 上使用开源 Feast 运行 Redis Enterprise 的快速入门教程。详细解释可在 Google Colab 上的教程本身中找到。 

本教程提供了逐步指南,引导您了解如何将 Feast 与 Redis Enterprise 一起用作 GCP 上 ML 的在线特征商店。它基于 Feast 快速入门教程,但并非使用默认的在线存储,而是使用 Redis Enterprise 作为其在线存储,以便大规模地提供实时预测。如果您不熟悉 Feast 或 Google Cloud 上的 Redis Enterprise,那么最快的入门方法就是学习这个有用的教程。

在本教程中,您将

  1. 在 Google Colab 上部署一个特征商店,其离线存储使用 Parquet 文件,在线存储使用 Google Cloud 上的 Redis Enterprise。
  2. 使用 Parquet 文件中的演示时间序列特征构建训练数据集。
  3. 将离线存储中的特征值物化(加载)到 Redis Enterprise 在线存储中。
  4. 从 Redis Enterprise 在线存储中读取最新特征进行推理。

您可以按照 Colab 笔记本中描述的步骤在 Google Colab 上运行本教程。

运行教程的先决条件

要运行本教程,您需要一个来自 Google Cloud Marketplace 的 Redis Enterprise 数据库实例。如果您没有通过 Google Cloud Marketplace 订阅 Redis Enterprise,您可以申领您的 免费 Google Cloud Marketplace $400 积分

教程场景和步骤

在本教程中,我们使用特征商店为网约车司机满意度预测模型生成训练数据并支持在线模型推理。在演示数据场景中,我们调查了一些司机,以确定他们对使用网约车应用的体验满意度。目标是为其余用户生成司机满意度预测,以便我们可以联系潜在不满意的用户。

教程步骤

  1. 安装 Feast 并在 Google Cloud Marketplace 中验证您的 Redis Enterprise 数据库。
  2. 创建一个特征仓库并将 Redis 配置为在线存储。
  3. 注册特征定义并部署您的特征商店。 
  4. 生成训练数据。
  5. 将特征加载到您的 Redis 在线存储中。
  6. 从 Redis 在线存储中获取特征向量进行推理。

接下来是什么?

在这篇博客文章和附带的 Colab 教程中,我们向您介绍了 Google Cloud 上的 Redis Enterprise 作为在线特征商店。我们简要介绍了流行的开源特征商店 Feast,并提供了关于如何将 Google Cloud 上的 Redis Enterprise 设置为 Feast 的在线存储的逐步教程。要了解有关 Redis Enterprise 的更多信息,请查看 Redis.com 的资源部分,其中包含更多博客文章、电子书、网络研讨会等等。

立即体验 Redis Enterprise 作为 Feast 部署的在线特征商店的速度和扩展能力!