誰でも ZABBIX

Zabbixの使い方、役に立つ情報、等々

3. PCのCPU温度の監視

サーバ機の場合は、CPUの温度やファンの回転数、電源の稼動状態をSNMP等で比較的簡単に取得することができ、容易に監視できるようになっています。

市販のPCの場合は、一般的にそのようなI/Fはないので、WMIなどで値を取得するフリーソフトなどで状態を確認することが多いと思います。

今回は、Core Tempというツールから温度データを取得し、Zabbixで記録する方法を確認します。

続きを読む

4. Zabbix serverの設定 - StartPollers

SNMP、Zabbixエージェント、外部スクリプト経由で監視データを取得する場合、Zabbixサーバのpollerプロセスがデータを取得します。

監視ホストやアイテムの数が増えていくと、pollerプロセスの処理能力を超えるタイミングが必ずきます。

今回は、pollerの起動数を増やす方法と、システムへの影響(メモリ使用量)を確認します。

続きを読む

3.Linuxプロセスのメモリ使用量 - proc.mem

Linuxの各プロセスのメモリ使用量は、Zabbixエージェントのproc.memで取得可能です(Windowsは未対応)。

このキー、オプションの指定に癖があり、マニュアルをよく確認しないで値を取得すると、間違ったデータを収集していることになります。

続きを読む

2. 監視アイテムの追加 - 依存アイテム

依存アイテムは、V3.4から追加された機能です。複数の情報が含まれるデータを1度取得すれば、そこから複数のアイテムに分割することができます。これにより、監視対象へのアクセス頻度を減らしたり、監視データの正確性を高めることができます。

たとえば、Webサーバから監視データを取得する場合、JSONXMLで結果を受け取ることが多いと思います。これらのデータを1項目ごとにアクセスすると、それなりの頻度でWebサーバにデータを取りにいくことになり、システム運用観点からはあまり望ましいやり方ではありません。 これまでは、一度にデータを取得して、外部スクリプトの中で分解しZabbix_senderで送る、というやり方もありましたが、外部スクリプトがどうしても複雑になってしまい、あまり効率のよい方法ではなかったと思います。

また、CPUやメモリの監視データは、各パラメタを同時に取得しないと、整合性が合わない値になってしまいますが、これらもSNMPやZabbixAgentのアイテム定義でデータの取得を同時に行うことはできないため、急激に値が変化した際、グラフのデータがおかしくなってしまうケースがありました。

これらの問題を、依存アイテムを使うことで、シンプルに記述することができるようになります。今回は、依存アイテムの基本的な部分を説明します。応用例は、また別のタイミングを紹介する予定です。

続きを読む

3. ログ監視 - 正規表現の指定方法

ログ監視のキーlog、logrtなどでは、2番目の引数で、対象の文字列を指定するための正規表現を指定します。

正規表現は、アイテム設定のキー欄で直接指定するだけでなく、ユーザマクロや、グローバル正規表現というシステム共通の正規表現も利用可能です。

続きを読む

5. チェックリスト - ログ監視がうまくいかない場合

ログ監視で値が取得できない場合に、チェックしたほうがよいポイントをまとめました。

慣れている方は、ログをみれば原因はわかると思いますが、Zabbixを始めたばかりの頃は、ログの内容を理解するのも難しいですし、そもそも慣れてないうちはログもエラーだらけでより理解が困難だったりするのではないかと思います。

ということで、今回はログ監視がうまくいかない場合に、チェックしたほうがよいポイントをできるだけ網羅してみたいと思います。

続きを読む

3. ログ監視 - logrt[]

ログファイルや、プログラムが作成するファイルの中のデータを監視する際、ファイル名が必ずしても一定でない場合があります。

キーlogrtは、ファイル名の部分を正規表現で指定し、複数のファイルをチェック対象とすることができます。

続きを読む