5. チェックリスト - ログ監視がうまくいかない場合
ログ監視で値が取得できない場合に、チェックしたほうがよいポイントをまとめました。
慣れている方は、ログをみれば原因はわかると思いますが、Zabbixを始めたばかりの頃は、ログの内容を理解するのも難しいですし、そもそも慣れてないうちはログもエラーだらけでより理解が困難だったりするのではないかと思います。
ということで、今回はログ監視がうまくいかない場合に、チェックしたほうがよいポイントをできるだけ網羅してみたいと思います。
チェックポイント
対策や説明は省略し、とりあえずチェックポイントのみ記載します。
ZabbixAgent側
- ZabbixAgentのログにエラーはでていないか?
- ZabbixAgent.confのActiveサーバのアドレスが正しいか?
- ZabbixAgent.confのhostnameは正しいか?
- ZabbixAgent.confの修正を行ってから、ZabbixAgentのリブートを行ったか?
- ZabbixAgentは動いているか?
- 監視対象のファイルは存在しているか?
- 監視対象のフォルダ/ディレクトリやファイルに、Zabbix Agentの読み込み権限はあるか?
- 指定したキーワードに指定したデータはファイルに本当に存在しているか?
- ファイルの文字コードはlogキーで指定した内容と同じか?
- ZabbixAgentから、Zabbixサーバにpingは通るか?
- Zabbix_senderでZabbixサーバにデータを送ることはできるか?
- ZabbixサーバまでのNW経路で、10051ポートへの通信が許可されているか?
- ZabbixサーバまでのNW経路で、ZabbixAgentのIPアドレスは許可されているか?
Zabbixサーバ側
- Zabbixサーバログにエラーがでていないか?
- Zabbixサーバ上でFWやsellinuxで受信パケットを拒否していないか?
- Trapperプロセスは動いているか?
- Zabbixは正常に動いているか?
- ログ監視以外の監視は正常に動いているか?
- キューにアイテムが滞留していないか?
- データベースサーバは稼動しているか?(MySQLにエラーがでていたりしないか?)
- Zabbixデータ収集プロセスのビジー率は正常か?
- 指定した正規表現は正しいのか?
- アイテムのデータ型はログにしているか?(数値系はNG)
- 監視間隔は適切か?(1mのつもりが、1hになっていないか?)
- 保存前処理に想定外の記述が残っていたりしないか?(アイテム複写するとありがち)
ログ監視は、サーバで設定した内容がクライアント側に反映されるまで、少しタイミングのずれがあるようです。うまくいっていないときは、(あわててしまい)修正した内容が反映されないうちに動確をしてうまくいっていないと判断してしまい、次々と設定を変えているうちに訳がわからなくなる、ということもありました・・・。
そういう時は、設定後に一度Zabbixサーバ、エージェント共にリスタートしてから、ログにデータを書き込んでみる、というのもおススメです。
また、監視アイテムだけでなく、NW環境に原因があったり、Zabbixサーバ自体が正常に稼動していない(共同で使っているサーバだとこういうことが結構あります)、ケースもあります。 ログ監視のデバッグは、なかなか厄介な作業の一つですが、上記のチェックポイントを一つ一つチェックすれば必ず原因は見つかります。