可観測性の可能性を引き出すには:Gartner Insights Pickup(381)
デジタルトランスフォーメーション(DX)の進展とクラウド環境におけるテレメトリーデータの増加に伴い、インフラとオペレーション(I&O)のリーダーは可観測性戦略を見直している。可観測性の導入、実務への活用にはメリットがあり、可観測性プラットフォームの実装を急いでいる企業は少なくない。本稿では、可観測性のメリットを実現するためのポイントを紹介する。
デジタルトランスフォーメーション(DX)の進展とクラウド環境におけるテレメトリーデータの増加に伴い、インフラとオペレーション(I&O)のリーダーは可観測性戦略を見直している。
多くの場合、企業が自社ソリューションとベンダーツールのどちらを使うかにかかわらず、可観測性データの保存と分析のコストがメリットを上回ることに気付きつつある。さらに、社内に各種のモニタリングツールが乱立し、さまざまなインタフェースやデータフォーマットの管理が必要となり、効率が悪くなっている。
複雑さと変化の速度が増す最新アーキテクチャに対応するため、I&Oリーダーは、従来のモニタリングから可観測性の活用に移行しなければならない。可観測性によって、ソフトウェアやシステムをその出力を通じて理解し、その挙動に関する質問に効果的に答えられるからだ。
可観測性を導入して実務に活用することには多くのメリットがあり、多くの企業が可観測性プラットフォームの実装を急いでいる。だが、これらのメリットを実現するには、以下の重要なポイントを考慮することが不可欠だ。
可観測性戦略を策定し、継続的に進化させる
可観測性への取り組みでは、費用対効果が厳しく問われる。マクロ経済状況や従量制の料金設定、クラウド支出の比重増加が背景にある。デバイスやホストの数に基づく従来のモニタリングとは異なり、最新の可観測性プラットフォームは、データ分析とそれによる価値ある洞察に焦点を当てている。
価値とコストを評価する
可観測性への支出を最適化するには、収集したデータの価値とそのコストを継続的に評価する必要がある。アプリケーションを観測するコストと、それによって得られる洞察の価値を比較評価することが重要だ。商用ベンダーのツールに関しては、使用状況と課金パターンを理解すれば、予期せぬ支出増や過剰支出を抑えるのに役立つ。詳細な課金情報は「どのデータを可観測性ツールに送る必要があるか」「どれだけの期間保持する必要があるか」を判断し、可観測性を活用するための予算と計画を立てる助けになる。
データ標準を採用する
Open Telemetry(OTEL)は、ほとんどのベンダーがサポートする新しい標準だ。テレメトリーデータの管理を簡素化するので、ソフトウェアライセンス費用の一部が不要になり、コスト削減に役立つ。また、OTELによってテレメトリーデータの収集を標準化することで、開発サイクルを加速できるほか、これらのデータの収集、処理を自社のニーズに合わせてカスタマイズしやすくなるため、カスタマイズやコンサルティングサービスにかかる費用などの運用コストを削減できる。
センターオブエクセレンスを設置する
I&Oチームとプラットフォームチームの主要なステークホルダーで構成され、可観測性への取り組みを推進する組織として、センターオブエクセレンス(CoE)を設置する。この組織は、データフォーマットの標準化、ツールのガバナンス、ベストプラクティス、自動化の導入による効率向上に責任を持たなければならない。
可観測性ツールセットを標準化する
既存のツールを評価し、自社の要件に合わせて整理、統合する。さらに、データフォーマットを標準化し、反復的なタスクを自動化して、不要なワークロードを最小限に抑えることで、業務を合理化し、効率を高めなければならない。
ツールとライフサイクルを管理する
クラウドネイティブ環境では、ほとんどの企業が毎日5〜10TB以上の膨大なテレメトリーデータを生成する。その最たるものがログデータだ。こうしたデータの管理は複雑で、コストがかさむ。
そこで、日々生成される大量のテレメトリーデータを扱うデータ管理戦略を導入する必要がある。この戦略では、コンプライアンスと業務上の必要性に基づいてテレメトリーデータの保持ポリシーを作成し、最終的にデータを変換し、充実させる処理技術を適用する。さらに、データから洞察を引き出すためのフィルタリングや集計、計算も行う。
こうしたテレメトリーのライフサイクル管理プロセスは、定期的に見直し、向上させることが重要だ。そのためには、進化するビジネス要件と技術の進歩に基づいて、データの最適化に加え、収集/処理/分析ワークフローを継続的に改善していく。
テレメトリーパイプラインを導入する
可観測性ツールによって収集されるテレメトリーデータの増大と複雑化に対処するため、テレメトリーパイプラインの導入が増加している。企業はテレメトリーパイプラインにより、データを収集し、充実させ、変換し、複数の宛先にルーティングできる。これはデータを管理し、取り込みと保存のコストを削減するのに役立つ。このアプローチでは、処理がパイプラインで実行され、データのフィルタリングや廃棄、ルーティング、変換によって取り込みを減らせる。
AI機能を活用し、プロセスと生産性を向上させる
AIは、可観測性の戦略的可能性を高める上で重要な役割を果たす。企業はAIと機械学習(ML)を活用することで、可観測性ツールによって収集された膨大なデータを効率的に分析し、他の方法では得られない洞察を得られる。具体的なメリットに焦点を当てながら、徐々にAIを導入していく必要がある。
AI導入のステップ
- AIについて現実的な期待を設定する
- 可観測性ツールのAI/ML機能を調査し、活用する
- 異常検知、推定原因分析、トリアージなど、成果の達成が見込めるユースケースを優先する
- 問題を予見するための予測分析と、原因と結果を理解するための原因分析を導入する
- 自然言語によるデータアクセスやコンテンツ作成に生成AIを利用する
- IT運用(ITOps)ワークフローとその修正を自動化することで、現行のツールを強化する
AIは、可観測性の活用とパフォーマンス問題のトラブルシューティングの大幅な高度化を可能にする。AI/ML機能を利用することで、企業は問題の検知、診断、解決を改善し、最終的にシステムパフォーマンスとユーザーエクスペリエンスの向上につなげられる。
出典:Unlocking the Potential of Observability(Gartner)
※この記事は、2024年10月に執筆されたものです。
Copyright © ITmedia, Inc. All Rights Reserved.