誰でも ZABBIX

Zabbixの使い方、役に立つ情報、等々

3. Zabbixインターナル監視のグラフ (7) - ログ、稼働時間

Zabbix Shareに公開したテンプレートで、Zabbixの状態を把握するための様々なグラフを一つのスクリーンで同時に確認することができます。

今回は、Zabbixのログおよび、稼働時間に関するグラフです。

今回紹介するグラフの配置です。
f:id:Unam:20180316201826p:plain

Zabbixのログ件数、ログファイルサイズ

Zabbixサーバ、Zabbixエージェントのログ監視のグラフがあります。それぞれ、ログの件数とファイルサイズが確認できます。

ログの件数

f:id:Unam:20180316202904p:plain

ログの件数は、log.count[]で条件を指定せず、全行カウントしています。 間隔はマクロで60秒を指定しています。

f:id:Unam:20180316204244p:plain

設定を変更していないのにログの量が急激に増えたり、不規則な動きをするようになったら、ログの内容をチェックしておくと、障害の早期検知、未然防止につながると思います。

Zabbixのログは、DebugLevel=3 であれば、異常がない時はログがほとんど出力されません。Zabbixサーバの場合は、以下のように、ハウスキーピングの記録のみ。Zabbixエージェントの場合は、異常がなければ、まったく何も出力されれません。

  6099:20180316:182148.037 housekeeper [deleted 12709 hist/trends, 0 items/triggers, 0 events, 0 problems, 0 sessions, 0 alarms, 0 audit items in 0.684016 sec, idle for 1 hour(s)]
  6099:20180316:192155.712 executing housekeeper
  6099:20180316:192156.448 housekeeper [deleted 12715 hist/trends, 0 items/triggers, 0 events, 0 problems, 0 sessions, 0 alarms, 0 audit items in 0.729386 sec, idle for 1 hour(s)]
  6099:20180316:202203.837 executing housekeeper
  6099:20180316:202204.426 housekeeper [deleted 12705 hist/trends, 0 items/triggers, 0 events, 0 problems, 0 sessions, 0 alarms, 0 audit items in 0.585215 sec, idle for 1 hour(s)]

監視設定を完了したら、必ずログにエラーが出ていないことを確認し、問題があればきちんと対処をしてから、監視運用を開始するようにしましょう。

ログのサイズ

f:id:Unam:20180316204652p:plain

Zabbixのログファイルは、アプライアンスやパッケージでインストールした場合、自動的にローテーションされることになっています。それでも、ローテーションの設定変更により実行されていなかったり、ログをデバッグモードにしたまま忘れていたり、といった要因でファイルサイズが増大していないか、グラフで見ればすぐに異常が把握できます。

稼働時間

何か問題が発生した際、 いつサーバをリブートしたか?いつアプリケーションを再起動したか?、というのが結構大事な情報になります。Zabbixの場合も、設定を変更したのに再起動していなかったために想定どおりに動いていなかった、というミスも結構あります。 稼働時間のグラフがあれば、何かあった際に、大まかにいつ頃、再起動が行われたか・否かがすぐにわかるので便利です。

f:id:Unam:20180316210212p:plain