2. 監視アイテムの追加 - Zabbixアグリゲート
システムの安定稼動を維持するには、トリガーによる異常検知だけではなく、管理者自身によるデータの定期的なチェックも重要です。
とはいえ、クラウドなどで大規模なシステムを運営されている場合は、個別の機器の値を一つ一つ見ていくことは現実的ではありません。
Zabbixアグリゲートは、複数機器の平均、最大/最小値を集計した結果を確認できるので、システム全体の動向を大まかに把握するのに適したアイテムです。
アイテム定義
以下の設定は、複数ホストのPingレスポンスの平均をZabbixアグリゲートで集計するアイテムの例です。
Zabbixアグリゲート 12 累計チェック [Zabbix Documentation 2.2]
値の確認
1分間隔で監視をしている複数ホストのPingの値を一つのグラフで確認すると、以下のような感じになります。
たとえ台数が数台でも、値がばらつくと結構全体の傾向を把握するのが難しくしなります。
これを上記でZabbixアグリゲートで確認すると、全体の傾向がわかりやすくなります。
今回の例は、数台の端末しかありませんが、同じような役割のサーバが数十台平行で動いているようなシステムでは、うまく使うと効率的に全体の状況を把握できると思います。
ワイルドカードは使えるか?
第1引数のホストグループは複数指定できます。ところが、第2グループの キー は完全一致しか許容されていません。そのため、LLDなど、キーのパラメタが違うアイテムを集計することができません(マニュアルに書いていないのですが、だめもとそれっぽい指定を試してみましたが、やっぱりだめでした)。
Zabbix supportのFeature requests 確認してみたところ、やはり結構前から要望が出ており、LLDへの対応希望はそれなりにあるようです。Zabbix4.0でも対応の予定がなさそうなので、遅ればせながら私も一票入れておきました。
[ZBXNEXT-1521] allow wildcards (or macros) in aggregate items - ZABBIX SUPPORT