dot 快速的未来正在您的城市举办的活动中到来。

加入我们参加 Redis 发布会

什么是数据摄取?

数据摄取是指收集、存储和处理大量高多样性、高速数据,这会带来一些复杂的设计挑战,尤其是在物联网 (IoT)、电子商务、安全、通信、娱乐、金融和零售等领域。鉴于响应式、及时和准确的数据驱动决策是这些企业的核心,因此实时数据收集和分析至关重要。

提供实时数据分析的重要第一步是确保有足够的资源来有效地捕获快速数据流。虽然物理基础设施(包括高速网络、计算、存储和内存)在此起着重要作用,但软件堆栈必须与其实物层的性能相匹配,否则组织可能会遇到大量数据积压、丢失数据或不完整、误导性的数据。


快速数据摄取的挑战和最佳实践

高速数据摄取通常会涉及不同类型的复杂性

  1. 大量数据以突发形式到达:突发数据需要能够以最小的延迟处理大量数据的解决方案。理想情况下,它应该能够每秒执行数百万次写入,延迟在毫秒以下,并使用最少的资源。
  2. 来自多个来源/格式的数据:数据摄取解决方案还必须足够灵活,能够处理多种格式的数据,在需要时保留源标识,并实时转换或规范化。
  3. 需要过滤、分析或转发的数据:大多数数据摄取解决方案都有一个或多个订阅者来使用数据。这些通常是运行在相同或不同位置的不同应用程序,它们有一组不同的假设。在这种情况下,数据库不仅要转换数据,还要根据使用应用程序的要求过滤或聚合数据。
  4. 管理生产者和各种类型消费者之间稳定的数据通道:如果数据到达模式不是连续的,那么生产者和消费者需要一个通道来让他们异步传输数据。该通道还必须能够抵御连接丢失和硬件故障。在许多用例中,生产者和消费者不会以相同的速率运行。这会导致数据积压,从而进一步延迟消费者对数据采取行动。
  5. 来自地理分布式来源的数据:在这种情况下,将底层架构的数据收集节点分布在靠近源的位置通常很方便。这样,节点本身就成为快速数据摄取解决方案的一部分,用于收集、处理、转发或重新路由摄取数据。

我们简化了快速数据摄取

以最少的服务器数量实现高性能

在性能方面,Redis 企业版已基准测试,能够在 AWS 上仅使用 40 节点集群每秒处理超过 2 亿次读/写操作,延迟在毫秒以下。这使得 Redis 企业版成为市场上最资源高效的 NoSQL 数据库。

灵活的数据结构和模块,用于实时分析:Redis Streams、发布/订阅、列表、排序集、时间序列

Redis 提供了各种数据结构,例如 Streams、列表、集、排序集和哈希,它们提供了简单而通用的数据处理,以便有效地将高速数据摄取与实时分析相结合。

Redis 的发布/订阅功能使它能够充当地理分布式数据摄取节点之间的有效消息代理。数据生产应用程序以所需格式将流数据发布到通道,而消费应用程序订阅与其相关的通道,并在数据发布时异步接收消息。

列表和排序集可用作连接生产者和消费者的数据通道。您还可以使用这些数据结构异步传输数据。与发布/订阅不同,列表和排序集提供持久性。

Streams 可以做更多,提供生产者和消费者之间的持久数据摄取通道。使用 Streams,您可以使用消费者组扩展消费者的数量。消费者组还在消费者在消费和处理数据的过程中出现故障时实施类似事务的数据安全。

最后,时间序列提供了增强的快速数据摄取功能集,包括降采样、对最后摄取值的特殊计数器操作以及双增量压缩,并结合了实时分析功能,例如使用内置搜索、聚合、范围查询和内置连接器来标记数据领先的监控和分析工具,例如 Grafana 和 Prometheus。

主动-主动地理分布式部署

Redis 企业版的基于 CRDT 的主动-主动技术支持跨地理位置执行复杂的数据摄取和消息传递操作,并使应用程序能够以完全分布式的方式部署,从而显着提高可用性和应用程序响应时间。

使用 SSD 和持久性内存扩展 Redis DRAM

Redis 企业版的自动分层技术支持使用 SSD 和持久性内存扩展 DRAM,允许使用与基于磁盘的数据库相同的基础设施成本存储非常大的多 TB 数据集,同时将数据库延迟保持在毫秒以下水平,即使在每个 Redis 企业版集群节点上每秒摄取超过 100 万项数据时也是如此。


相关资源

帖子

2019 年 6 月 27 日

RedisTimeSeries GA:让第四维真正沉浸式

今天,我们很高兴地宣布 RedisTimeSeries v1.0 正式发布 (GA)。RedisTimeSeries 是 Redis 开发的一个 Redis 模块,旨在增强您管理时间序列的体验…

帖子

2018 年 6 月 26 日

主动-主动 Redis – 现在支持排序集和列表

我们很高兴地宣布 Redis 企业版 v5.2 发布,其中包含备受期待的功能,例如:这些功能简化了应用程序开发,并为您的 Redis 企业版提供了更高的安全性…

wpx-docs

2017 年 8 月 18 日

Redis 用于快速数据摄取

大数据用例通常需要实时流数据摄取。Redis 企业版可以做到。