视频

了解更多
如果您开始了一项新的工作,并在与您的第一位客户的第一次会议上,配备了两天关于容量规划、DNS 问题、地理分布和 .NET 开发的计划,然后您得到的第一问题是:“我们如何有效地监控集群和数据库?”您会怎么说?
好吧,凭借 16 年的运营经验,我认为我已经准备好了。 但实际上,当然,“我学得越多,我就越意识到自己不知道的东西有多少。” 现在,当我看到一个新的软件时,我首先想到的问题之一是如何确保它在生产环境中正常运行? 换句话说,我该如何监控它?
考虑到这一点,我写了这篇关于 Redis Enterprise 监控选项的总结,从系统内置的监控功能到 Prometheus Metrics Exporter——许多组织的最佳选择——以及 REST API,以便最灵活地与第三方监控系统集成。 我将这篇博文献给世界各地的运营人员——他们不仅想要运行 Redis Enterprise,而且还希望完全享受其完美的性能。
Redis Enterprise 的集群管理 UI 监控控制台通常是开始监控 Redis 的最佳场所。 它在视觉上很有吸引力,不需要任何额外的安装或配置。 使用“分钟”间隔,它几乎是实时的;您还可以在 5 分钟、小时、天、周、月和年间隔之间切换。 UI 在单独的屏幕中提供集群、每个集群节点和每个数据库的指标:
Redis Enterprise 集群管理 UI 监控控制台为集群、节点和数据库指标提供单独的屏幕。
Redis Enterprise 也有一个警报机制。您可以为集群和每个数据库设置单独的警报。 警报显示在管理 UI 的相关页面上(集群警报显示在“集群”页面上,依此类推),您可以配置警报以通过电子邮件 (SMTP) 发送,如下所示
显示的指标和警报集包括所有主要指标,因此您可以在完成安装后几分钟内开始监控您的 Redis Enterprise。 但是,如果您需要更多呢? 具体来说,如果您想将 Redis Enterprise 集成到您公司现有的监控基础设施中呢? 这就是 Prometheus 和 Grafana 的用武之地。
Prometheus 和 Grafana 是一对世界著名的组合,共同创建了最可靠的现代监控工具之一。 Redis Enterprise Cluster 软件包含一个 Prometheus 指标的导出器,因此任何监控集成最具挑战性的任务——收集正确的指标——都会自动完成。
这有助于快速轻松地设置和配置 Prometheus 和 Grafana。 Redis 文档包括与 Prometheus 集成的说明、导出的指标的综合列表和基本的 Grafana 仪表板。 指标在节点、数据库、分片和代理级别公开。 可以在 Prometheus AlertManager 中设置警报,并通过十几种不同的渠道(包括电子邮件、Slack、PagerDuty 等)方便地传递。
对于许多公司来说,Prometheus 和 Grafana 代表了监控 Redis 的最佳方式,更不用说各种其他现代硬件和软件了。
同样重要的是,使用 Prometheus Metrics Exporter,各种具有从 Prometheus 导出器抓取指标能力的监控平台都可以连接到 Redis Enterprise。 例如,New Relic 最近发表了一篇关于 将 New Relic 与 Prometheus 导出器集成 的博文。
REST API
对于需要更高灵活性的公司,Redis Enterprise REST API 提供了大量功能,包括获取统计指标和警报。 REST API 是实现第三方监控集成(无论是内部还是行业标准)的最通用和最灵活的方式。 REST API 文档可以在每个安装了 Redis Enterprise 软件的节点上的 usr/share/doc/redis/rlec_rest_api.tar.gz 目录中找到。
使用 REST API 的一个很好的例子是 适用于 Splunk 的 Redis Enterprise 插件,可在 Splunk 市场上找到。 另一个很好的例子是 AppDynamics 插件,可在 AppDynamics Exchange 获得。
总而言之,很明显 Redis Enterprise 配备了完善的监控功能,让客户可以选择在特定情况下使用哪种监控解决方案。
我认为,如果 Redis Enterprise 的内置监控对您来说不够用,那么最好的选择通常是 Prometheus 和 Grafana。 尤其是它可以与许多流行的企业监控系统配合使用。 如果该解决方案不适用于您的组织,则可以使用 REST API 与几乎任何第三方监控系统集成。 如果所有这些选项都不可接受,那么,是时候发挥创意了!