2. 各種設定(基本)
システムの安定稼動のためには、アプリケーション関連の設定ファイルが変更されていないことを監視することも重要です。たとえ運用ルールで手動での更新が禁止されていたとしても、操作担当者がミスで変更してしまうこともありますし、構成管理システムを使…
監視データが正常に取得できなかったり、想定どおりにトリガーが発行されない場合があります。通常は、監視対象に問題があったり、テンプレートやホストの設定に誤りがあることがほとんどです。 まれに、監視対象にも監視設定にもまったく問題がない(なかっ…
システムの安定稼動を維持するには、トリガーによる異常検知だけではなく、管理者自身によるデータの定期的なチェックも重要です。 とはいえ、クラウドなどで大規模なシステムを運営されている場合は、個別の機器の値を一つ一つ見ていくことは現実的ではあり…
SSH(Secure Shell)は、Linux系OSでほぼ標準でサポートされており、多数のLinuxサーバ・機器を監視する場合に、エージェントレスで監視アイテムを取得できる便利な機能です。 接続には、パスワード方式と公開鍵方式があります。
計算アイテムは、機器やシステムの状態を正確に把握したり、適切なアラートを発行するために欠かせないアイテムです。 書式はちょっとだけ癖があり、最初は少しわかりづらいかもしれませんが、慣れると非常に便利なアイテムなので、ぜひ積極的に使ってみてく…
国内では、日本法人が提供する有料の技術サポートや、日本語で質問ができる無料のコミュニティもあります。 日本法人の提供する有償サービスは、Zabbixフォーラムでも多くの方が語られている通り、非常に対応も早く、丁寧なサポートを提供をしており、企業ユ…
SNMPトラップやログファイルのデータでトリガーを発行させる場合は、クローズするタイミングや条件を考えておかないと、トリガーの条件を上手に設定しないと、障害の状態を適切に把握するのが難しくなるかもしれません。 Zabbix3.2から、トリガーの手動クロ…
監視データにトリガーを設定する場合、ある値を超えたら警告を出し、さらに状況が悪化したら障害、としたいケースがあります。 トリガーの依存関係を使用すれば、状況に応じたトリガーをシンプルに設定することができます。
障害通知を行うために、様々なトリガーを定義すると、一つの事象が発生した際にも複数のアラートメッセージがメールで通知されてしまい、実際の問題がわかりづらくなる場合があります。 そのような状況を避けるために、Zabbixではトリガーの依存関係を設定す…
サーバ機の場合は、CPUの温度やファンの回転数、電源の稼動状態をSNMP等で比較的簡単に取得することができ、容易に監視できるようになっています。 市販のPCの場合は、一般的にそのようなI/Fはないので、WMIなどで値を取得するフリーソフトなどで状態を確認…
Linuxの各プロセスのメモリ使用量は、Zabbixエージェントのproc.memで取得可能です(Windowsは未対応)。 このキー、オプションの指定に癖があり、マニュアルをよく確認しないで値を取得すると、間違ったデータを収集していることになります。
依存アイテムは、V3.4から追加された機能です。複数の情報が含まれるデータを1度取得すれば、そこから複数のアイテムに分割することができます。これにより、監視対象へのアクセス頻度を減らしたり、監視データの正確性を高めることができます。 たとえば、W…
WindowsやLinuxの監視を行う場合、SNMPでもある程度のレベルの監視することが可能です。SNMPエージェントは、わざわざインストールしなくても、最初から含まれていて、簡単なセットアップで監視が開始できます。 一方、Zabbix Agentで監視を行う場合は、必ず…
障害の発生と復旧の通知、特に、障害が収束した状態の認識・通知方法は、運用管理の品質や効率化に関わる重要なポイントです。Zabbixのトリガーは、復旧条件も柔軟に設定可能です。
トリガー関数のなかで、lastは最新の監視データを取得する用途で非常によく使います。 私自身、last関数を使う時は99.99%引数なしで使っていますが、過去のデータを参照しようとした際、きちんとマニュアルを読まずに適当な引数を入れて使用し、思ったとおり…
SNMPやWebAPIで取得する監視データは、文字列データに変換しないと、内容がわからないデータが結構ありまります。 HTTPのエラーコード 404 なら、Page not foundと答えられる人は多いですよね。では、505 は?? HTTP Version Not Supported 、だそうです・…
2回に分けて、アイテムの保存前処理の紹介をしています。 前回は計算、差分、数値変換の各設定を確認しました。 2. アイテムの保存前処理 - 計算、差分、数値変換 - 誰でも ZABBIX 今回は、正規表現、文字列削除、XML XPath、JSON Pathを設定を紹介します。
V3.4より、アイテム画面の中で指定していた値の乗数や、差分保存の指定項目が、別タブの保存前処理という画面で指定するように変更になりました。 別画面になったことは不便ですが、その分、xpathやjson pashのサポートなど、非常に強力な機能が備わっていま…
ヒストリは、監視アイテムの設定時に指定した間隔で取得したデータをそのまま保存しているデータです。監視間隔を短く指定すると、当然のことながらあっという間にデータのサイズが大きくなり、Zabbixサーバのパフォーマンスに様々な悪影響を与える可能性が…
Zabbixアプライアンスは、最初からSNMPトラップが受信可能な状態になっています。 まずは、比較的シンプルな設定でSNMPトラップを監視データとして取り込み、監視対象からどのようなトラップデータが飛んでくるのかよく観察してから、監視設定の詳細を検討す…
監視対象からデータを取得するには、SNMPやZabbixAgentで対応できるケースが多いと思います。 最近は、WebAPIでデータを取得するインフラや、アプリケーションが増えて得いるので、そこからデータを取得するために、外部スクリプトを使った監視が必要になり…
Zabbixは、取得したデータに指定した単位を付けて表示します。一部の単位名では、あらかじめ決められたルールでデータが変換されるので、内容を理解して、適切な単位を指定しましょう。
Zabbixのグラフは、プリセットされている表示範囲と、スライドバーでかなり直感的に選択できます。ただ、ちょっとわかりずらいのが、日時を直接指定するケースです。 グラフの期間指定には、fixedとdynamicという二つのモードがあり、その違いを理解していな…
通常、監視アイテムはZabbixサーバから、監視対象にデータを取りにいきます。 Zabbixトラッパーは、その逆で、監視対象側から任意のタイミングでデータを送ることができます。 実際にコマンドラインで確認すると、非常に単純でわかりやすい機能だということ…
アプリケーション は、ネーミングからその機能がちょっと想定しづらいのですが、ようは、監視したデータをグルーピングする際の名称です。 うまく使うと、データの確認が格段にしやすくなります。
数値を扱うことが可能なデータ型には、2つの型があります。 数値(整数) 数値(浮動小数) 整数で定義していたアイテムに小数を入れ場合、常にエラーになるわけではなく、小数点以下が切り捨てられて納され、エラーにならないケースもあります。どのような…
Zabbixでは、監視データから任意のグラフの作成が非常に簡単にできるようになっています。 そのなかで、少しだけわかりづらい点があるので、その辺を簡単に説明します。 今回は、アイテムごとに指定する関数 です。
シンプルチェックは、監視対象に対して、特定のプロトコルでの通信が可能か、どの程度のレスポンスがあるか、というチェックが可能です。 シンプルrチェックは、Pingだけでなく、TCPやUDPでのチェックが可能で、通信ができるかどうかだけではなく、応答時間…
Zabbixでは、定期的な監視間隔の指定だけでなく、特定の日、曜日、日時にだけ監視データを取得する、という設定も可能です。 この機能は更新間隔のカスタマイズという設定欄で指定が可能です。カスタマイズには、例外設定と定期設定があります。
Zabbixは指定した間隔で定期的に監視データを取得します。 更新間隔の指定は、監視ツールにとって非常に重要なポイントですが、Zaabbix3.4からこの部分が大きく改善され、より柔軟な指定が可能になりました。 改善されたポイントは以下の2点です。 更新時間…