3. Zabbixインターナル監視のグラフ (1) - 処理数
Zabbix Shareに公開したテンプレートで、Zabbixの状態を把握するための様々なグラフを一つのスクリーンで同時に確認することができます。
何回かに分けてこのスクリーンで確認できるグラフの内容と使い方を紹介します。
今回紹介するグラフの配置です。
要求監視数と実際の監視数
スクリーンの一番左上にあるグラフ Zabbix server performance required and actual で、Zabbixの要求監視数と、Zabbixが実際に処理を行った件数を確認できます。
緑色の線が要求監視数で、明るい緑色の面が実際の処理数を表しています。
要求監視数は、ダッシュボードに表示される 1秒あたりの監視項目数(Zabbixサーバーの要求パフォーマンス) と同じです。
このグラフは、理想的には要求処理数と実際の処理数が一致しているのが望ましいです。ただ、上記のグラフもそうですが、正常時でも値が一致しない場合があります。
要求処理数が多い場合
- Zabbixエージェントのアクティブを使用している
- 監視データがnot suportedになている
- 高負荷のため、Zabbixが設定した更新間隔で値が取得できない
このうち、Zabbixエージェントのアクティブは監視自体に問題がなくても値が一致しない要因になります。 ログ監視や、イベント監視は、実際に監視対象のデータが発生した場合だけZabbix_serverにデータが送られてきますが、監視設定上は一定間隔で監視することになっているので、実際よりも要求処理数が増えてしまう要因になってしまいます。
要求処理数が少ない場合
要求処理数よりも実際の処理数が多い場合があります。
- 依存アイテムを使っている
依存アイテムは、監視設定時に監視間隔を指定する欄がないためか、要求監視数に含まれていないようです。マスターアイテムが一定間隔で値を取得するアイテムの場合、依存アイテムもその分値は処理されるので、実際の処理数が多くなるようです。
多少の差はありますが、このグラフの値は、基本的に一定のパターンで推移するはずです(ログ監視をしている場合、多少の不規則な増減はあると思いますが)。
このグラフを定期的に確認していれば、異常が発生して監視データが取得できなくなったり、設定の変更が行われたかどうか、といった基本的な変化を察知することができます。定常監視はまずこのグラフを見るところから初める前提で、左端の一番上に配置しています。
処理数の内訳
処理を行ったデータの内訳は Zabbix values processed - detail で確認できます。
監視台数が多くなると、どんなデータがどの程度発生しているのか、だんだんわからなくなってきます。テキスト系のデータは、一般的に1件当たりのデータサイズが大きくなります。知らない間にこれらのデータの収集が増えていないか、このグラフで確認することができます。
また、Not supportedのなったデータがどの程度発生したかも、このグラフで確認できます。
このグラフで使用しているキー zabbix[wcache,values,データタイプ] の値を正しく取得するには、Zabbixの3.4.7以降のバージョンを使う必要があります。