Prometheus 指标 v2 预览版
Prometheus 可用的 V2 指标始于 Redis Enterprise Software 7.8.2 版本。
您可以将 Redis Enterprise Software 与 Prometheus 和 Grafana 集成,以创建重要指标的仪表板。
以下表格中的 V2 指标始于 Redis Enterprise Software 7.8.0 版本。有关从 V1 指标迁移到 V2 PromQL 的帮助,请参阅Prometheus v1 指标和等效的 v2 PromQL。
V2 抓取端点也暴露了 node_exporter
1.8.1 版本的指标。更多信息请参阅 Prometheus node_exporter GitHub 仓库。
数据库指标
指标 | 类型 | 描述 |
---|---|---|
endpoint_client_connections | counter | 客户端连接建立事件的数量 |
endpoint_client_disconnections | counter | 由客户端发起的连接断开次数 |
endpoint_client_connection_expired | counter | TTL(生存时间)过期的客户端连接总数 |
endpoint_client_establishment_failures | counter | 未能正常建立的客户端连接数 |
endpoint_client_expiration_refresh | counter | 客户端过期时间变更的次数 |
endpoint_client_tracking_off_requests | counter | CLIENT TRACKING OFF 请求的总数 |
endpoint_client_tracking_on_requests | counter | CLIENT TRACKING ON 请求的总数 |
endpoint_disconnected_cba_client | counter | 基于证书的客户端断开连接的数量 |
endpoint_disconnected_ldap_client | counter | LDAP 客户端断开连接的数量 |
endpoint_disconnected_user_password_client | counter | 用户名/密码客户端断开连接的数量 |
endpoint_disposed_commands_after_client_caching | counter | 因误用而被丢弃的客户端缓存命令总数 |
endpoint_egress | counter | 出站字节数 |
endpoint_egress_pending | counter | 待发送字节数 |
endpoint_egress_pending_discarded | counter | 因连接断开而被丢弃的待发送字节数 |
endpoint_failed_cba_authentication | counter | 基于证书认证失败的客户端数 |
endpoint_failed_ldap_authentication | counter | LDAP 认证失败的客户端数 |
endpoint_failed_user_password_authentication | counter | 用户名/密码认证失败的客户端数 |
endpoint_ingress | counter | 入站字节数 |
endpoint_longest_pipeline_histogram | counter | 跟踪观察到的最长管道长度的分布,其中管道是客户端发送命令序列而不等待响应。 |
endpoint_other_requests | counter | 其他请求数 |
endpoint_other_requests_latency_histogram | histogram | 其他命令的延迟(单位 µs)直方图 |
endpoint_other_requests_latency_histogram_bucket | histogram | 非读写命令的延迟直方图。可用于表示不同的延迟百分位数。 p99.9 示例 histogram_quantile(0.999, sum(rate(endpoint_other_requests_latency_histogram_bucket{cluster="$cluster", db="$db"}[$__rate_interval]) ) by (le, db)) |
endpoint_other_responses | counter | 其他响应数 |
endpoint_proxy_disconnections | counter | 由代理发起的客户端连接断开次数 |
endpoint_read_requests | counter | 读取请求数 |
endpoint_read_requests_latency_histogram | histogram | 读取命令的延迟(单位 µs)直方图 |
endpoint_read_requests_latency_histogram_bucket | histogram | 读取命令的延迟直方图。可用于表示不同的延迟百分位数。 p99.9 示例 histogram_quantile(0.999, sum(rate(endpoint_read_requests_latency_histogram_bucket{cluster="$cluster", db="$db"}[$__rate_interval]) ) by (le, db)) |
endpoint_read_responses | counter | 读取响应数 |
endpoint_successful_cba_authentication | counter | 通过基于证书认证成功的客户端数 |
endpoint_successful_ldap_authentication | counter | 通过 LDAP 认证成功的客户端数 |
endpoint_successful_user_password_authentication | counter | 通过用户名/密码认证成功的客户端数 |
endpoint_write_requests | counter | 写入请求数 |
endpoint_write_requests_latency_histogram | histogram | 写入命令的延迟(单位 µs)直方图 |
endpoint_write_requests_latency_histogram_bucket | histogram | 写入命令的延迟直方图。可用于表示不同的延迟百分位数。 p99.9 示例 histogram_quantile(0.999, sum(rate(endpoint_write_requests_latency_histogram_bucket{cluster="$cluster", db="$db"}[$__rate_interval]) ) by (le, db)) |
endpoint_write_responses | counter | 写入响应数 |
节点指标
指标 | 类型 | 描述 |
---|---|---|
node_available_flash_bytes | gauge | 节点中的可用闪存(字节) |
node_available_flash_no_overbooking_bytes | gauge | 节点中的可用闪存(字节),未考虑超额预订 |
node_available_memory_bytes | gauge | 节点中可用于数据库配置的可用空闲内存量(字节) |
node_available_memory_no_overbooking_bytes | gauge | 节点中的可用 RAM(字节),未考虑超额预订 |
node_bigstore_free_bytes | gauge | 所有集群节点上后端闪存(由闪存数据库 [BigRedis] 使用)的空闲空间总和(字节);仅在启用 BigRedis 时返回 |
node_cert_expires_in_seconds | gauge | 给定节点的证书过期时间(秒);详细了解 Redis Enterprise 中的证书和监控证书 |
node_ephemeral_storage_avail_bytes | gauge | 配置的临时磁盘上 RLEC 进程可用的磁盘空间(字节) |
node_ephemeral_storage_free_bytes | gauge | 配置的临时磁盘上的空闲磁盘空间(字节) |
node_memory_MemFree_bytes | gauge | 节点中的空闲内存(字节) |
node_persistent_storage_avail_bytes | gauge | 配置的持久磁盘上 RLEC 进程可用的磁盘空间(字节) |
node_persistent_storage_free_bytes | gauge | 配置的持久磁盘上的空闲磁盘空间(字节) |
node_provisional_flash_bytes | gauge | 考虑到超额预订、最大 Redis 服务器数、保留闪存以及配置和迁移阈值,此节点上可用于新分片的闪存量(字节) |
node_provisional_flash_no_overbooking_bytes | gauge | 未考虑超额预订、最大 Redis 服务器数、保留闪存以及配置和迁移阈值,此节点上可用于新分片的闪存量(字节) |
node_provisional_memory_bytes | gauge | 从分配给数据库的总 RAM 中可用于配置给数据库的 RAM 量 |
node_provisional_memory_no_overbooking_bytes | gauge | 从分配给数据库的总 RAM 中可用于配置给数据库的 RAM 量,未考虑超额预订 |
node_metrics_up | gauge | 节点是集群的一部分且已连接 |
集群指标
指标 | 类型 | 描述 |
---|---|---|
generation{cluster_wd=<node_uid>} | gauge | 特定 cluster_wd 的世代号 |
has_qourum{cluster_wd=<node_uid>, has_witness_disk=BOOL} | gauge | Has_qourum = 1 无仲裁 = 0 |
is_primary{cluster_wd=<node_uid>} | gauge | primary = 1 secondary = 0 |
license_shards_limit | gauge | 按分片类型(RAM / 闪存)的许可证总分片限制 |
total_live_nodes_count{cluster_wd=<node_uid>} | gauge | 存活节点数 |
total_node_count{cluster_wd=<node_uid>} | gauge | 节点数 |
total_primary_selection_ended{cluster_wd=<node_uid>} | counter | 每个已结束选择过程的单调计数器 |
total_primary_selections{cluster_wd=<node_uid>} | counter | 每个已开始选择过程的单调计数器 |
复制指标
指标 | 类型 | 描述 |
---|---|---|
database_syncer_config | gauge | 用作配置标签的占位符 |
database_syncer_current_status | gauge | 流量的同步器状态;0 = 同步,2 = 不同步 |
database_syncer_dst_connectivity_state | gauge | 目标连接状态 |
database_syncer_dst_connectivity_state_ms | gauge | 目标连接状态持续时间 |
database_syncer_dst_lag | gauge | 同步器和目标之间的延迟(毫秒) |
database_syncer_dst_repl_offset | gauge | 最后确认命令的偏移量 |
database_syncer_flush_counter | gauge | 目标刷新次数 |
database_syncer_ingress_bytes | gauge | 从源分片读取的字节数 |
database_syncer_ingress_bytes_decompressed | gauge | 从源分片读取的字节数 |
database_syncer_internal_state | gauge | 同步器的内部状态 |
database_syncer_lag_ms | gauge | 源和目标之间的流量延迟时间(毫秒) |
database_syncer_rdb_size | gauge | 同步阶段要传输的源 RDB 大小(字节) |
database_syncer_rdb_transferred | gauge | 同步阶段从源 RDB 传输的字节数 |
database_syncer_src_connectivity_state | gauge | 源连接状态 |
database_syncer_src_connectivity_state_ms | gauge | 源连接状态持续时间 |
database_syncer_src_repl_offset | gauge | 最后已知源偏移量 |
database_syncer_state | gauge | 分片同步器的内部状态 |
database_syncer_syncer_repl_offset | gauge | 同步器处理的最后命令的偏移量 |
database_syncer_total_requests | gauge | 目标写入次数 |
database_syncer_total_responses | gauge | 已确认的目标写入次数 |
分片指标
指标 | 描述 |
---|---|
redis_server_active_defrag_running | 自动内存碎片整理当前侵略性(CPU 百分比) |
redis_server_allocator_active | 总已用内存,包括外部碎片 |
redis_server_allocator_allocated | 总已分配内存 |
redis_server_allocator_resident | 总驻留内存 (RSS) |
redis_server_aof_last_cow_size | 最后一次 AOFR,CopyOnWrite 内存 |
redis_server_aof_rewrite_in_progress | 正在进行的同步 AOF 重写次数 |
redis_server_aof_rewrites | 此进程执行的 AOF 重写次数 |
redis_server_aof_delayed_fsync | AOF fsync 导致主 Redis 线程延迟(引起延迟)的次数;这可能表明磁盘速度慢或负载过重 |
redis_server_blocked_clients | 等待阻塞调用的客户端数量 |
redis_server_connected_clients | 到特定分片的客户端连接数 |
redis_server_connected_slaves | 连接的副本数 |
redis_server_db0_avg_ttl | 所有易失性键的平均 TTL |
redis_server_expired_keys | 易失性键的总数 |
redis_server_db0_keys | 总键数 |
redis_server_evicted_keys | 到目前为止(自重启以来)被逐出的键数 |
redis_server_expire_cycle_cpu_milliseconds | 在活动过期周期上花费的累计时间量 |
redis_server_expired_keys | 到目前为止(自重启以来)过期的键数 |
redis_server_forwarding_state | 分片转发状态(开启或关闭) |
redis_server_keys_trimmed | 在当前或上次重新分片过程中被修剪的键的数量 |
redis_server_keyspace_read_hits | 访问现有键空间的读取操作次数 |
redis_server_keyspace_read_misses | 访问不存在键空间的读取操作次数 |
redis_server_keyspace_write_hits | 访问现有键空间的写入操作次数 |
redis_server_keyspace_write_misses | 访问不存在键空间的写入操作次数 |
redis_server_master_link_status | 指示副本是否连接到其主节点 |
redis_server_master_repl_offset | 分片发送到副本的字节数;通过比较不同时间点的值来计算一段时间内的吞吐量 |
redis_server_master_sync_in_progress | 主分片正在同步(1 true;0 false) |
redis_server_max_process_mem | redis_mgr 根据节点空闲内存配置的当前内存限制 |
redis_server_maxmemory | redis_mgr 根据数据库内存限制配置的当前内存限制 |
redis_server_mem_aof_buffer | AOF 缓冲区当前大小 |
redis_server_mem_clients_normal | 非副本客户端输入输出缓冲区当前使用的内存 |
redis_server_mem_clients_slaves | 副本客户端输入输出缓冲区当前使用的内存 |
redis_server_mem_fragmentation_ratio | 内存碎片率(1.3 表示 30% 开销) |
redis_server_mem_not_counted_for_evict | used_memory(字节)中不计入逐出和 OOM 错误的内存部分 |
redis_server_mem_replication_backlog | 复制积压大小 |
redis_server_module_fork_in_progress | 一个二进制值,指示模块是否生成了活动的 fork(1 表示是;0 表示否) |
namedprocess_namegroup_cpu_seconds_total | 分片进程 CPU 使用率(秒) |
namedprocess_namegroup_thread_cpu_seconds_total | 分片主线程 CPU 使用时间(秒) |
namedprocess_namegroup_open_filedesc | 分片打开的文件描述符数量 |
namedprocess_namegroup_memory_bytes | 分片内存大小(字节) |
namedprocess_namegroup_oldest_start_time_seconds | 分片进程自 Unix 纪元以来的启动时间(秒) |
redis_server_rdb_bgsave_in_progress | 指示 bgsave 是否正在进行中 |
redis_server_rdb_last_cow_size | 最后一次 bgsave(或 SYNC fork)使用的 CopyOnWrite 内存 |
redis_server_rdb_saves | 自进程重启以来的 bgsave 总计数(包括副本全量同步和持久化) |
redis_server_repl_touch_bytes | 分片作为处理 READ 命令的结果,以 TOUCH 命令形式发送到副本的字节数;通过比较不同时间点的值来计算一段时间内的吞吐量 |
redis_server_total_commands_processed | 分片处理的命令数;通过比较不同时间点的值来计算一段时间内的命令数 |
redis_server_total_connections_received | 分片接收的连接数;通过比较不同时间点的值来计算一段时间内的连接数 |
redis_server_total_net_input_bytes | 分片接收的字节数;通过比较不同时间点的值来计算一段时间内的吞吐量 |
redis_server_total_net_output_bytes | 分片发送的字节数;通过比较不同时间点的值来计算一段时间内的吞吐量 |
redis_server_up | 分片正在运行 |
redis_server_used_memory | 分片使用的内存(在 BigRedis 中包括闪存)(字节) |
redis_server_search_gc_bytes_collected | 垃圾收集器从分片内存中的索引释放的总内存量(字节)。3 |
redis_server_search_bytes_collected | 垃圾收集器从分片内存中的索引释放的总内存量(字节)。在 8.0 版本中已弃用(重命名为 redis_server_search_gc_bytes_collected),但在旧版本中仍然可用。1 |
redis_server_search_gc_marked_deleted_vectors | 在矢量索引中标记为已删除但尚未清理的矢量数量。3 |
redis_server_search_marked_deleted_vectors | 在矢量索引中标记为已删除但尚未清理的矢量数量。在 8.0 版本中已弃用(重命名为 redis_server_search_gc_marked_deleted_vectors),但在旧版本中仍然可用。1 |
redis_server_search_gc_total_cycles | 执行的垃圾收集周期总数。3 |
redis_server_search_total_cycles | 执行的垃圾收集周期总数。在 8.0 版本中已弃用(重命名为 redis_server_search_gc_total_cycles),但在旧版本中仍然可用。1 |
redis_server_search_gc_total_docs_not_collected_by_gc | 标记为已删除但其内存尚未被垃圾收集器释放的文档数量。3 |
redis_server_search_total_docs_not_collected_by_gc | 标记为已删除但其内存尚未被垃圾收集器释放的文档数量。在 8.0 版本中已弃用(重命名为 redis_server_search_gc_total_docs_not_collected_by_gc),但在旧版本中仍然可用。1 |
redis_server_search_gc_total_ms_run | 分片中所有垃圾收集周期总持续时间(毫秒)。3 |
redis_server_search_total_ms_run | 分片中所有垃圾收集周期总持续时间(毫秒)。在 8.0 版本中已弃用(重命名为 redis_server_search_gc_total_ms_run),但在旧版本中仍然可用。1 |
redis_server_search_cursors_internal_idle | 分片中当前持有待处理结果的协调器游标总数。3 |
redis_server_search_cursors_user_idle | 分片中用户明确请求且当前持有待处理结果的游标总数。3 |
redis_server_search_global_idle | 分片中当前持有待处理结果的用户和内部游标总数。在 8.0 版本中已弃用(拆分为 redis_server_search_cursors_internal_idle 和 redis_server_search_cursors_user_idle),但在旧版本中仍然可用。1 |
redis_server_search_cursors_internal_active | 分片中正在持有待处理结果或正在主动执行 FT.CURSOR READ 的协调器游标总数。3 |
redis_server_search_cursors_user_active | 分片中正在持有待处理结果或正在主动执行 FT.CURSOR READ 的用户游标总数。3 |
redis_server_search_global_total | 分片中正在持有待处理结果或正在主动执行 FT.CURSOR READ 的用户和内部游标总数。在 8.0 版本中已弃用(拆分为 redis_server_search_cursors_internal_active 和 redis_server_search_cursors_user_active),但在旧版本中仍然可用。1 |
redis_server_search_number_of_indexes | 分片中的索引总数1 |
redis_server_search_number_of_active_indexes | 正在运行后台索引和/或后台查询处理操作的索引总数。后台索引是指矢量摄取过程或正在进行的后台索引器。1 |
redis_server_search_number_of_active_indexes_running_queries | 当前正在运行后台查询进程的索引总数。1 |
redis_server_search_number_of_active_indexes_indexing | 当前正在进行后台索引过程的索引总数。后台索引是指矢量摄取过程或正在进行的后台索引器。此指标受分配用于写入操作的 WORKER 线程数 + 索引数的限制。1 |
redis_server_search_total_active_write_threads | 分片中当前正在运行的后台写入(索引)进程总数。后台索引是指矢量摄取过程或正在进行的后台索引器。此指标受分配用于写入操作的线程数限制。1 |
redis_server_search_fields_text_Text | 分片中所有索引中 TEXT 字段的总数。1 |
redis_server_search_fields_text_Sortable | 分片中所有索引中 SORTABLE TEXT 字段的总数。此字段仅在值大于 0 时显示。1 |
redis_server_search_fields_text_NoIndex | 分片中所有索引中 NOINDEX TEXT 字段的总数;即仅用于排序但未索引。此字段仅在值大于 0 时显示。1 |
redis_server_search_fields_numeric_Numeric | 分片中所有索引中 NUMERIC 字段的总数。1 |
redis_server_search_fields_numeric_Sortable | 分片中所有索引中 SORTABLE NUMERIC 字段的总数。此字段仅在值大于 0 时显示。1 |
redis_server_search_fields_numeric_NoIndex | 分片中所有索引中 NOINDEX NUMERIC 字段的总数,这些字段仅用于排序但未索引。此字段仅在值大于 0 时显示。1 |
redis_server_search_fields_tag_Tag | 分片中所有索引中 TAG 字段的总数。1 |
redis_server_search_fields_tag_Sortable | 分片中所有索引中 SORTABLE TAG 字段的总数。此字段仅在值大于 0 时显示。1 |
redis_server_search_fields_tag_NoIndex | 分片中所有索引中 NOINDEX TAG 字段的总数;即仅用于排序但未索引。此字段仅在值大于 0 时显示。1 |
redis_server_search_fields_tag_CaseSensitive | 分片中所有索引中 CASESENSITIVE TAG 字段的总数。此字段仅在值大于 0 时显示。1 |
redis_server_search_fields_geo_Geo | 分片中所有索引中 GEO 字段的总数。1 |
redis_server_search_fields_geo_Sortable | 分片中所有索引中 SORTABLE GEO 字段的总数。此字段仅在值大于 0 时显示。1 |
redis_server_search_fields_geo_NoIndex | 分片中所有索引中 NOINDEX GEO 字段的总数;即仅用于排序但未索引。此字段仅在值大于 0 时显示。1 |
redis_server_search_fields_vector_Vector | 分片中所有索引中 VECTOR 字段的总数。1 |
redis_server_search_fields_vector_Flat | 分片中所有索引中 FLAT VECTOR 字段的总数。1 |
redis_server_search_fields_vector_HNSW | 分片中所有索引中 HNSW VECTOR 字段的总数。1 |
redis_server_search_fields_geoshape_Geoshape | 分片中所有索引中 GEOSHAPE 字段的总数。2 |
redis_server_search_fields_geoshape_Sortable | 分片中所有索引中 SORTABLE GEOSHAPE 字段的总数。此字段仅在值大于 0 时显示。2 |
redis_server_search_fields_geoshape_NoIndex | 分片中所有索引中 NOINDEX GEOSHAPE 字段的总数;即仅用于排序但未索引。此字段仅在值大于 0 时显示。2 |
redis_server_search_fields_ |
由于尝试索引包含 <field> 字段的文档而导致的索引失败总数。1 |
redis_server_search_used_memory_indexes | 分片中所有索引分配的总内存量(字节)。1 |
redis_server_search_smallest_memory_index | 分片中内存使用量最小的索引的内存使用量(字节)。1 |
redis_server_search_largest_memory_index | 分片中内存使用量最大的索引的内存使用量(字节)。1 |
redis_server_search_total_indexing_time | 花费在索引操作上的总时间,不包括 HNSW 图中矢量的后台索引。1 |
redis_server_search_used_memory_vector_index | 分片中所有矢量索引的总内存使用量。1 |
redis_server_search_global_idle | 分片中当前持有待处理结果的用户和内部游标总数。1 |
redis_server_search_global_total | 分片中正在持有待处理结果或正在主动执行 FT.CURSOR READ 的用户和内部游标总数。1 |
redis_server_search_bytes_collected | 垃圾收集器从分片内存中的索引释放的总内存量(字节)。1 |
redis_server_search_total_cycles | 执行的垃圾收集周期总数1 |
redis_server_search_total_ms_run | 分片中所有垃圾收集周期总持续时间(毫秒)。1 |
redis_server_search_total_docs_not_collected_by_gc | 标记为已删除但其内存尚未被垃圾收集器释放的文档数量。1 |
redis_server_search_marked_deleted_vectors | 在矢量索引中标记为已删除但尚未清理的矢量数量。1 |
redis_server_search_total_queries_processed | 分片中成功的查询执行总数(使用游标时,不计算从现有游标读取)。1 |
redis_server_search_total_query_commands | 成功的查询命令执行总数(包括 FT.SEARCH 、FT.AGGREGATE 和 FT.CURSOR READ )。1 |
redis_server_search_total_query_execution_time_ms | 所有查询命令(包括 FT.SEARCH 、FT.AGGREGATE 和 FT.CURSOR READ )的累计执行时间(毫秒)。1 |
redis_server_search_total_active_queries | 分片中当前正在执行的后台查询总数,不包括 FT.CURSOR READ 。1 |
redis_server_search_errors_indexing_failures | 分片中所有索引记录的索引失败总数。1 |
redis_server_search_errors_for_index_with_max_failures | 失败计数最高的索引中的索引失败次数。1 |