简介:监控和指标|点燃文档

点燃2023年峰会-按需观看-立即注册!

编辑

简介:监控和指标

本章涵盖点火的监控和指标。我们将从可用于监视的方法的概述开始,然后深入研究Ignite细节,包括JMX度量和MBean的列表。

概述

点火监测的基本任务涉及指标。您有几种访问指标的方法:

要监视的内容

您可以从监视开始:

  • 孤立的每个节点

  • 节点之间的连接

  • 整个系统

注意,节点由几个层组成:硬件、操作系统、虚拟机(JVM等)和应用程序。您需要检查所有这些级别网络围绕着它。

  • 硬件(虚拟机监控程序):CPU/内存/磁盘⇒系统日志/云提供程序日志

  • 操作系统

  • JVM:GC日志、JMX、Java飞行记录器、线程转储、堆转储等。

  • 应用程序:日志、JMX、吞吐量/延迟、测试查询

    • 对于基于日志的监控,关键是您可以主动采取行动,观察日志中的趋势等,而不是等到出现问题时才检查日志。

  • 网络:ping监测、网络硬件监测、TCP转储

这应该为您提供了一个很好的起点,可以开始设置对硬件、操作系统和网络的监控。要监控应用程序层(构成内存计算解决方案的节点),您需要通过JMX/Beans访问的指标或通过编程方式执行特定于Ignite的监控。

全局与节点特定指标

通过不同指标公开的信息具有不同的范围(适用性),并且可能因获取指标的节点而异。以下列表解释了不同的度量范围。

全球指标

提供有关集群的一般信息,例如:节点数、集群状态。此信息在集群的任何节点上都可用。

节点特定指标

提供特定于获取度量的节点的信息,例如:内存消耗、数据区域度量、WAL大小、队列大小等。

与缓存相关的度量可以是全局的,也可以是特定于节点的。例如,缓存中的条目总数是一个全局度量,您可以在任何节点上获得它。您还可以获取存储在特定节点上的缓存条目数,在这种情况下,它将是特定于节点的度量。