想象一下,您访问一个游乐园,大量食用所有四种主要游乐园食物(当然分别是玉米狗、油炸饼、冰沙和棉花糖),然后在旋转木马上疯狂旋转。您刚食用的食物量和种类(以及我们敢说速度?)可能会让您的胃不堪重负,导致不适,并迫使它放慢速度并重新组合,以适应当天的放纵。
但您的软件堆栈没有时间放慢,即使是一毫秒的零点几秒也不行;它需要处理任何扔给它的数据,而不会冒汗或服用胃药。 快速数据摄取和处理 越来越成为大数据用例的常见需求,内部利益相关者和客户都期望(并依赖于)它带来的实时决策能力。
收集、存储和处理大量高种类、高速度的数据是一项任务,它带来了许多复杂的设计挑战——尤其是在物联网、电子商务、安全、通信、娱乐、金融和零售等领域。
而这正是 Redis 的真正优势所在。它以其他快速数据摄取解决方案无法比拟的轻松方式应对这些挑战,这些解决方案往往过于复杂,而且对于简单的需求来说过于复杂。
事实上,在 TechValidate 对 Redis 客户进行的一项独立调查中,74% 的受访者表示他们将 Redis 用于消息传递和数据摄取。
我们概述了一些让 Redis 如此适合消息传递、数据流和快速数据摄取的突出功能。
在性能方面,Redis 已 基准测试 处理每秒超过一百万次读/写操作,在一个或两个服务器的中等大小商品云实例上延迟低于毫秒。这使得 Redis 成为市场上最节约资源的 NoSQL 数据库。
Redis 提供各种数据结构,例如列表、集合、有序集合和哈希表,这些数据结构提供了简单而通用的数据处理,以有效地结合高速数据摄取和实时分析。通过利用专门为支持目标任务(例如时间序列分析、空间分析、机器学习等)而构建的数据结构,分析操作会获得很大的性能提升,因为这些数据结构不仅提供了更优雅地存储可变结构数据的方法,而且还自带执行复杂数据库内分析的操作,直接在数据存储的内存中进行。
Redis 的发布/订阅功能带来的另一个性能提升,它可以作为地理分布式数据摄取节点之间的有效消息代理。生产数据的应用程序以所需格式发布流数据到频道,而消费数据的应用程序订阅与其相关的那些频道,并在数据发布时异步接收消息。
对于以 TB 为单位测量的 dataset,来自 Redis 的 Redis Enterprise 得以增强,可在 RAM 和闪存的组合上运行。 能够同时在 RAM 中存储键和热数据,在更经济高效的闪存中存储冷数据,极大地降低了运营成本,而不会影响响应能力。 对于越来越普遍的大型 dataset,这是在大型数据规模上提供内存内性能的最经济高效的方式。
我们最近发布了一篇名为 用于快速数据摄取的 Redis 的白皮书。 它概述了在设计快速数据摄取解决方案时遇到的挑战,以及 Redis 如何在付出极少努力的情况下解决这些挑战。 对于那些喜欢深入研究的人来说,有一个示例快速数据摄取场景可以遵循,以及三种不同的方法,包括代码(哦,是的!),用于完成该场景。
随着贵组织的大数据需求不断增长,请记住,实现高速摄取和实时处理高容量、高种类、高速度数据无需让您头痛 —或您的系统胃痛。 只需使用 Redis Enterprise 即可。