3. 監視対象ホストのファイル参照
障害が発生した際に、関連するログや設定ファイルの内容をZabbixから確認できるようにしておくと便利です。実際に運用している環境だと、ログインするのにもいろいろ手順が面倒だったりしますし、確認したいファイルの場所がわからないということもありがちです。
続きを読む3.ファイルの変更チェック
システムの安定稼動のためには、アプリケーション関連の設定ファイルが変更されていないことを監視することも重要です。たとえ運用ルールで手動での更新が禁止されていたとしても、操作担当者がミスで変更してしまうこともありますし、構成管理システムを使っている場合でも、意図していないファイルの更新をしてしまうケースもあります。
設定ファイルの内容を変更すると、直後に問題が発生する場合だけでなく、数日後に問題が発生することもあります。その場合、アプリケーションの設定変更が行われていることを認識していないために、原因究明に時間がかかってしまうこともあります。
そのような状況を防ぐために、重要な設定ファイルは状態を監視し、場合によっては変更をトリガーで通知できるようにしておけば、このような事故を未然に防ぐことも可能です。
Zabbixエージェントには、ファイルの状態をチェックするためのキーがいくつか用意されています。これらのキーでどのような値が取得できるか、実際に確認します。
続きを読む3.rootユーザでUserparameterの実行
vfs.dir.sizeのように、Linuxのファイルの情報を取得しようとすると、Zabbixエージェントにそのファイルへのアクセス権がなく、値が取得できない場合あります。そのような場合、Zabbixエージェントをroot権限で実行する方法もありますが、実際の運用環境では、セキュリティの観点からZabbixエージェントのroot権限での実行が許可されないケースあると思います。
Zabbixでは、Userparameterで情報を取得するコマンドを個別に作成することもできるので、そのコマンドをsudoのリストに登録しておくことで、root権限がないとアクセスできないコマンドやファイルの実行するやりかもあります。
続きを読む4. Zabbix serverの設定 - AllowRoot
ZabbixサーバやZabbixエージェント(unix版)は通常、”zabbix”ユーザとして動作しています。 Zabbixサーバの外部スクリプト、Zabbixエージェントのログ監視やUserparameterなどでは、Zabbixユーザでアクセスできないコマンドやファイルがあるケースがあります。そのような場合は、それぞれのコンフィグファイルを変更することで、Zabbixをrootユーザとして実行することでき、許可されていなかった処理も実行可能になります。
もちろん、実際の運用環境でrootユーザとしてZabbixを実行させるのは望ましいやり方ではありません。ただ、開発環境などで一時的に動作確認するには手っ取り早い方法です。
続きを読む4. Zabbix serverの設定 - CacheUpdateFrequency
WebUIで変更したアイテムは、一定間隔で監視プロセスに更新されます。デフォルトの設定間隔は60秒です。通常はこの設定問題はないのですが、アイテムやトリガーの条件などを試行錯誤しながら確認していると、変更結果をすぐに確認することができず、作業効率が悪くなってしまいます。
この設定はzabbix_server.confの CacheUpdateFrequencyで変更が可能です。
設定を調整している間はこの値を短くしておいたほうが、更新結果がすぐに反映されて効率が良くなります。今回は、CacheUpdateFrequencyを短くした場合に、どの程度システムの負荷が上がるか確認してみます。
続きを読む4. Zabbixサーバのログレベル変更
思ったとおりに監視データの値が取れなかったり、トリガーの挙動がおかしい場合、ログで詳細情報を確認することで調査の手がかりが掴めることもあります。
ログのレベルは、Zabbixサーバのコンフィグファイルで設定しますが、コマンドでZabbixサーバを実行したまま変更することも可能です。
続きを読む