誰でも ZABBIX

Zabbixの使い方、役に立つ情報、等々

2.トリガーの依存関係 (2)

監視データにトリガーを設定する場合、ある値を超えたら警告を出し、さらに状況が悪化したら障害、としたいケースがあります。

トリガーの依存関係を使用すれば、状況に応じたトリガーをシンプルに設定することができます。

続きを読む

2.トリガーの依存関係 (1)

障害通知を行うために、様々なトリガーを定義すると、一つの事象が発生した際にも複数のアラートメッセージがメールで通知されてしまい、実際の問題がわかりづらくなる場合があります。

そのような状況を避けるために、Zabbixではトリガーの依存関係を設定することで、同時に複数のトリガーが発生することを抑制する仕組みがあります。

続きを読む

3. PCのCPU温度の監視

サーバ機の場合は、CPUの温度やファンの回転数、電源の稼動状態をSNMP等で比較的簡単に取得することができ、容易に監視できるようになっています。

市販のPCの場合は、一般的にそのようなI/Fはないので、WMIなどで値を取得するフリーソフトなどで状態を確認することが多いと思います。

今回は、Core Tempというツールから温度データを取得し、Zabbixで記録する方法を確認します。

続きを読む

4. Zabbix serverの設定 - StartPollers

SNMP、Zabbixエージェント、外部スクリプト経由で監視データを取得する場合、Zabbixサーバのpollerプロセスがデータを取得します。

監視ホストやアイテムの数が増えていくと、pollerプロセスの処理能力を超えるタイミングが必ずきます。

今回は、pollerの起動数を増やす方法と、システムへの影響(メモリ使用量)を確認します。

続きを読む

3.Linuxプロセスのメモリ使用量 - proc.mem

Linuxの各プロセスのメモリ使用量は、Zabbixエージェントのproc.memで取得可能です(Windowsは未対応)。

このキー、オプションの指定に癖があり、マニュアルをよく確認しないで値を取得すると、間違ったデータを収集していることになります。

続きを読む

2. 監視アイテムの追加 - 依存アイテム

依存アイテムは、V3.4から追加された機能です。複数の情報が含まれるデータを1度取得すれば、そこから複数のアイテムに分割することができます。これにより、監視対象へのアクセス頻度を減らしたり、監視データの正確性を高めることができます。

たとえば、Webサーバから監視データを取得する場合、JSONXMLで結果を受け取ることが多いと思います。これらのデータを1項目ごとにアクセスすると、それなりの頻度でWebサーバにデータを取りにいくことになり、システム運用観点からはあまり望ましいやり方ではありません。 これまでは、一度にデータを取得して、外部スクリプトの中で分解しZabbix_senderで送る、というやり方もありましたが、外部スクリプトがどうしても複雑になってしまい、あまり効率のよい方法ではなかったと思います。

また、CPUやメモリの監視データは、各パラメタを同時に取得しないと、整合性が合わない値になってしまいますが、これらもSNMPやZabbixAgentのアイテム定義でデータの取得を同時に行うことはできないため、急激に値が変化した際、グラフのデータがおかしくなってしまうケースがありました。

これらの問題を、依存アイテムを使うことで、シンプルに記述することができるようになります。今回は、依存アイテムの基本的な部分を説明します。応用例は、また別のタイミングを紹介する予定です。

続きを読む

3. ログ監視 - 正規表現の指定方法

ログ監視のキーlog、logrtなどでは、2番目の引数で、対象の文字列を指定するための正規表現を指定します。

正規表現は、アイテム設定のキー欄で直接指定するだけでなく、ユーザマクロや、グローバル正規表現というシステム共通の正規表現も利用可能です。

続きを読む