dot Redis 8 来了——而且是开源的

了解更多

回复:4月23日 AWS EU-WEST-1 服务中断

本周二,4月23日,亚马逊云的 eu-west-1 数据区域经历了服务降级。虽然一些人在 Twitter 上报告了 AWS 的连接问题和节点故障,但它并没有被广泛宣传。分析此事件对我们服务的影响,可以为我们和我们的客户提供有关 Redis 自动故障转移机制效率的宝贵见解。

AWS 欧盟区域发生的是多节点故障事件,其中同一 Redis 集群中的多个节点暂时不可用。在某些集群中,节点逐个受到影响,而在另一些情况下,所有节点同时发生故障,导致不同的结果。

  • 订阅我们Multi-AZ 计划的客户,其中集群在多个可用区中同时运行,在 Amazon 云故障期间完全免受损害。

  • 使用我们的内存复制功能的客户在遇到连续发生故障的节点时,没有经历任何停机或数据丢失。 感谢我们的即时故障转移机制,来自故障节点的所有数据都被不断复制到功能正常的节点上。

  • 由于 Amazon 的连接问题,同时遇到节点故障的客户确实经历了停机。但是,他们所有的数据都使用我们采用的解决方案完全恢复了。 Redis 能够将数据持久化到 EBS。 感谢这一点,我们设法快速地从所有故障节点恢复了数据,并将其交付给启用了数据持久性的用户。 我们还注意到,一些使用我们的备份到 S3 功能的客户无需我们干预即可快速恢复他们的数据。

Amazon 的某些服务中断了几个小时,我们的运营部门一直在监控情况。 令我们惊喜的是,实际上很少有客户就此问题与我们联系。 能够观察到我们的服务在发生故障转移时如何保护我们的客户免受损害,这令人鼓舞。

我们在 Redis 提供几种不同的机制,旨在保护我们的客户免受这些情况的影响。 考虑使用我们服务的组织应考虑此事件,以便做出适合他们所需保护级别的明智决定。

查看这篇文章,了解有关我们高可用性机制的更多信息