検索
連載

Zabbix 4.0では、運用管理者の負担を減らすためにどんな機能が追加されたのかクラウド/コンテナ時代のZabbix再入門(後編)(2/2 ページ)

2018年10月2日にリリースされたZabbix 4.0の新機能について、運用管理者の負担を減らす機能を中心に紹介する。

PC用表示 関連情報
Share
Tweet
LINE
Hatena
前のページへ |       

4.0で追加された機能で何ができるのか?

 機能だけを挙げても、「どのように活用できるか」が十分に伝わらないことも考えられるため、より具体的な例を挙げます。

障害対応確認の迅速化

 これまでは、アイテムを新規に作成した後で、アイテムの値が取得できるかを確認するためには、単純に放置してアイテムの値の取得タイミングになるのを待つしかありませんでした。また、発生していた障害の対応が終了して、正常な状態になってアイテムの値として正常な値が取得できる状態になったことを確認するのも、放置して待つしかありませんでした。

 Zabbix 4.0では、アイテムに対して「監視データ取得」(英語UIだと「Check now」)というボタンが用意されました。すぐに値を取得したいアイテムの設定を開いて、一番下にある「監視データ取得」というボタンを押すと、アイテムで設定されている監視間隔とは別に、すぐに値を取得する処理が行われるようになりました。

 アイテム以外でも、ディスカバリルールに対してもこの「監視データ取得」ボタンが用意されました。すぐにディスカバリルールを実行したい場合は、ディスカバリルールの一覧を表示させ、ディスカバリルールを選択して「監視データ取得」ボタンを押します。

 単純に待つだけではなく、より積極的に状態を確認して作業を進めることができるようになりました。

 また、障害が発生してトリガーで検知され、アクションでメール通知が行われた後で、Zabbix自体ではトリガーの状態として「障害」と「正常」しかありません。「障害が発生したことを認識して調査や対応に着手したのかどうか」については、ZabbixのWebインタフェースを開いて、「コメントが入力されているかどうか」で判断するか、別のインシデント管理ツールなどを利用して対応状況を記録するように運用するしかありませんでした。

 Zabbix 4.0では、障害に対するコメント入力時に、障害の深刻度を変更したり、障害を確認したかどうかのチェックを付けたりすることができるようになりました。そして、3.4から実装されていた、「確認済みのコメントを入力したときにアクションで通知を行える」機能と組み合わせることで、発生した障害の状態の変化や対応状況を共有できます。

 通知の設定は、アクションの設定内の「更新時の実行内容」タブ内の設定で行います。

 つまり、ZabbixのWebインタフェースを開かなくても、状態の変化やコメントのメッセージをアクションによって受け取れるため、障害対応状況の共有や確認をより早くスムーズにできるようになったと思います。

新しいグラフウィジェットによる視覚化のバリエーション追加

 前節でも紹介しましたが、ダッシュボードに利用できる新しいグラフウィジェットを使用することで、以下のようなことが簡単にできるようになりました。

  • 複数ホストの同じメトリクスを1つのグラフに表示
  • LLDで取得した単一ホストの複数メトリクスを1つのグラフに表示

 ワイルドカードを使用する場合は、ホストの名前やアイテムの名前にワイルドカードを使用できるような命名規則にしておくことが必要ですが、そのような命名規則の環境であれば、動的に変化する環境でも、設定の変更を行わずに同じグラフに表示させることができます。例えば、複数ノードへの負荷分散がうまくいっているかなどをグラフで判断しやすくなったと思います。

タグによる一部トリガーのみのメンテナンス設定

 これまではホストまたはホストグループ全体をメンテナンス期間という設定によって、トリガーでの発報抑止しかできませんでした。つまり、メンテナンス作業を行う機能以外で障害が発生したときに、メンテナンス期間の設定が行われてしまっていると、その障害の通知できなくなってしまう問題がありました。

 Zabbix 4.0では、メンテナンス期間の設定で、メンテナンス期間の対象としてタグを設定することができ、そのタグの付与されたトリガーのみのアクションでの通知を抑止できるようになりました。

 例えば、夜間のバッチ処理時にバッチ処理中のみに正常に処理をしていても高い数値になってしまうようなCPUの使用率やディスクのI/Oに関するトリガーを無視するようにして、他の継続的に稼働していなければならない機能に関する異常値を監視し続けるようなことができるようになったわけです。

 メンテナンス期間の設定では、以下の箇所にタグの設定箇所があります。

Webサービスの呼び出しと値の取得

 さまざまなシステムやサービスから情報を取得する際、Webサービスによって外部から情報を取得できるサービスも増えてきていると思います。

 これまでは、そういったWebサービスを利用して値を取得するためには、スクリプトを作成して、HTTP(HTTPS)のリクエストを投げて応答を受信し、その受信した結果から値を取り出す処理を自作する必要がありました。

 Zabbix 4.0で追加された、「HTTPエージェント」というタイプのアイテムを利用することでWebサービスを呼び出せるようになったことと、Zabbix 3.4で追加された、依存アイテムとアイテムの「保存前処理」を組み合わせることによって、JSONやXMLでの応答から、特定の属性値のみを取り出すことが、Webインタフェースでの設定だけでできるようになりました。

まとめ

 Zabbix 3.0の後に追加されたさまざまな機能を活用することで、監視設定作業の効率化とシステムやサービスの状況把握のサポート、不要な障害通知の削減などが実現できます。運用管理だけではなく、サービスの提供情報を把握するためにも、機能が拡張されています。

 各種クラウドやコンテナなどに対応した監視用テンプレートは、標準のテンプレートとしては用意されてませんが、拡張性を持ち、自動化もサポートできる機能を活用することで、さまざまな環境の監視に利用できます。

 一部の環境に関しては、さまざまな利用者がテンプレートなどを共有しているサイト(Zabbix Share)があったり、Zabbix社のパートナー企業がソリューションを持っていたりするので、それらを利用する方法も検討してみてはいかがでしょうか。

 ソリューションの紹介としては、インテグレーションのページ「Monitoring and Integration Solutions β」が公開されています。このサイトでは、カテゴリーで分類されて整理されているので、より早く目的のソリューションを見つけることができるようになっています。

 Zabbix社は、今後もさまざまな機能の追加や拡張を行う予定です。ロードマップとして、次バージョンでの組み込む予定の機能などを公開しています。それらのページも参照してみてください。機能によっては、対応する機能に対するチケットへのリンクも用意していて、そこで「具体的に、どのような実装とするのか」の意見交換も行われていることが確認できます。

 どのような機能が実装されていくのか気になる方は、ぜひチェックしてみてください。

参考リンク

Copyright © ITmedia, Inc. All Rights Reserved.

前のページへ |       
ページトップに戻る