複雑化したITシステム、最適なリソースを割り振るにはITリソースの自動管理がもたらすもの

クラウド化で新旧システムが混在する中、アプリケーションのどこで何が起きているのかを正確に把握するためには、何が必要なのだろうか? 2021年8月24日にライブ配信されたオンラインセミナーから、日本IBMのセッション「顧客体験を損なわないアプリケーション起点のIT運用」についてレポートする。

» 2021年09月27日 10時00分 公開
[PR/@IT]
PR

アプリケーションがビジネスをけん引する時代の課題と解決の方向性

 現在多くの企業では、さまざまな優れたアプリケーションがビジネスをけん引している。顧客のエンゲージや収益の増加、販売方法の革新的進化、他社との差別化、顧客からの支持獲得を実現する上で、こうしたアプリケーションは欠かせない存在となっている。

 だが、クラウドネイティブのアプリケーションが乱立した結果、システムの開発や運用面においてさまざまな課題が顕在化しつつある。例えば開発面では、高い質を確保しつつ、より迅速なデリバリーが求められるようになっており、さらにDevOps導入で増えたツールの管理や障害対応などで現場が疲弊している。また運用面では、技術的な複雑性が増し、システムを俯瞰(ふかん)的に見ることが極めて困難になっている。

日本IBMの堤 康広氏

 セッションの冒頭で「もはや従来の監視方法でシステムの全体像を可視化することは困難です。見えないものは管理できません。企業は自身の提供しているサービスを正確に理解できない状況にあり、このままではDevOpsチームは可観測性のカオスに突入してしまうでしょう」と警鐘を鳴らすのは、日本IBM テクノロジー事業本部 データ・AI・オートメーション事業部の堤 康広氏だ。

 さらに、こうした課題を放置した場合の顧客体験として、サービスダウンや障害の多発、レスポンスタイムの低下などが予想されるという。「インシデントがもたらす機会損失社会的信用の低下さらに機会損失増大につながる負のスパイラルに陥らないためにも、アプリケーション起点でのサービスレベル監視や障害対応によって、障害を未然に防ぐ、もしくは早急に解決するアプローチが求められています」と堤氏は語る。

APM+ARM+AIOpsで、アプリケーション起点のIT運用管理を実現

 これらの課題を解決し、アプリケーション起点でのIT運用を行うために、IBMはAIOps(Artificial Intelligence for IT Operations)を活用したソリューションを提供する。APM(Application Performance Monitoring:アプリケーション・パフォーマンス監視)製品の「Instana」やARM(Application Resource Management:アプリケーション・リソース管理)製品の「Turbonomic」、さらには統合管理基盤としての「IBM Cloud Pak for Watson AIOps」などで構成するソリューションだ。

 このうちInstanaは、複雑な環境を正確に把握できないという課題や、問題の箇所と影響範囲の特定ができないといった課題に対応する。コードレベルでのアプリケーション監視や、構成・依存関係を自動で認識し継続的に監視する機能、しきい値では分からない異常をAIで検知するといった機能を提供する。

 一方Turbonomicは、アプリケーションのボトルネック分析が難しいという課題や、リソースとコスト最適化の判断がつかないなどの課題に対応する。リソースレベルのアプリケーション監視や、フルスタックでのアプリケーションとリソースの依存関係の可視化、アプリケーションの性能を維持するリソース最適化アクションの作成といった機能を提供する。

 IBMは2020年11月にINSTANAを、2021年4月にTurbonomicの買収を発表している。現在はオンプレミスとクラウドの両方で、アプリケーションやインフラのモニタリングから、パフォーマンスの分析と洞察・改善、障害回復アクションの自動実行・予兆検知による障害の回避までをカバーするAIOpsソリューションをトータルに提供している。

アプリケーションからインフラまでのフルスタックをAIで可視化、最適化

 今回のセッションでは、IBMのAIOpsソリューションの一翼を担うTurbonomicを詳しく紹介した。

Turbonomic an IBM companyの河野雅憲氏

 アプリケーションの複雑化でますます困難になりつつあるITリソースの管理にソリューションを提供するのがTurbonomicだ。クリティカルなアプリケーションが必要とするリソースを提供し続けることで、企業のビジネスを支えるという。

 TurbonomicのAIエンジンは、独自のデータモデルを用いた抽象化(Abstraction)とリアルタイムかつ継続的な分析(Analytics)、意思決定の自動化(Automation)という3つの「A」を特徴とする。ワークロードの再配置の他、リソースの拡張・縮小、クラウドインスタンスやデータベースのサイズ変更、ストレージのTier変更、コンテナのスペック変更といった意思決定を自動化する。

 「Turbonomicは、IT環境最適化のための意思決定エンジン、制御エンジンと考えていただければ結構です」と語るのは、Turbonomic an IBM Company セールスエンジニアリング部の河野雅憲氏だ。

 下図は複雑化したアプリケーションのフルスタックを示している。

Turbonomicアプリケーション性能管理(提供:日本IBM)

 アプリケーションが分散化することで、複数の管理部門がそれぞれ異なる管理ツールを使い、異なるデータを管理するようになっている。これによって、いわゆるツールのサイロ化が発生している。

 「通常、アプリケーション開発者や管理者は、APMツールやアプリケーションレイヤーのみを管理・監視しています。一方でクラウド管理やインフラ管理を行うIT運用チームは、アプリケーションのことを理解せず、インフラのみを管理・監視しており、ネットワーク管理者にも同様のことが言えます。Turbonomicを導入することにより、アプリケーションからインフラまでフルスタックをビジュアル化して解析し、各管理部門のギャップを埋め、継続的にインフラのリソースを管理することが可能になります」(河野氏)

コストと性能の両面をにらんだクラウドの最適化が可能なTurbonomic

 Turbonomicの特徴として、河野氏は下記4つを挙げる。

特徴1 共通のデータモデルで解析

 アプリケーションやオンプレミス、ハイブリッドクラウド、コンテナ、インフラから情報を継続的に収集し、共通のデータモデルを用いて抽象化し、解析する。異なる管理部門でデータを共有でき、信頼性の向上も期待できる。

特徴2 アプリケーションにフォーカスしてデータ可視化

 アプリケーションがどこからどの程度ITリソース(CPUやメモリ、ストレージなど)を得ているか、“サプライチェーン”を可視化し、アプリケーション性能との相関を明確にする。

特徴3 リアルタイムのデータ解析

 独自のデータモデルで抽象化されたサプライチェーンをリアルタイムに分析する。アプリケーションへのアクセスは常に変化し続けるため、リアルタイムでITリソース消費量を把握し、継続的に分析することが重要だという。

特徴4 意思決定と実行を自動化

 リソース消費状況をリアルタイムに把握した上で、インフラ最適化のためのアクションを瞬時に継続的に自動生成する。さらに、そのアクションの実行も自動化する。手動やスケジュールによる実行も可能だ。

 Turbonomicの実際のUIを下図に示す。各ワークロードで複雑な意思決定を自動的に行うことで、人的対応が難しい大規模環境にも対応する。

アプリケーション性能にフォーカスした自動分析(提供:日本IBM)

 Turbonomicの解析エンジンはパブリッククラウド環境でも有効だ。現在、パブリッククラウドが提供するインスタンスやストレージ層の構成オプションの種類は膨大で、頻繁に更新される最新のカタログから各ワークロードに最適なオプションを見つけ出すのは至難の業となっている。

 さらにアプリケーションのリソース需要は常に変化を続け予測不能だ。Turbonomicを利用することで、最新のリソース利用状況に応じ、インスタンスやデータベースの再選考、ストレージのTierの変更など最適化アクションを自動生成できる他、実際にアクションを実行した場合に期待されるコスト削減額までを把握できる。多くのクラウド管理ツールがコスト削減のみを評価しているのに対し、Turbonomicはアプリケーション性能劣化防止にもフォーカスして評価しており、コストと性能の両面をにらんだクラウドの最適化が可能だ。

Turbonomicはどのようなシナリオで能力を発揮できるのか

 セッションの最後にTurbonomicの活用シナリオが4つ紹介された。

シナリオ1 オンプレミス環境の性能管理と運用効率化

 オンプレミスで構築した仮想デスクトップにおいて、性能劣化を未然に防ぎたい、ソフトウェアのライセンスコストを含むインフラのコストを削減したい、運用効率を改善したいといった課題やニーズに対し、Turbonomicは、仮想マシンの再配置や再選考などのリソース判断と最適化のアクションを自動で行う。

 こうしてアプリケーションや仮想デスクトップ環境の性能を継続的に保証する。リソースの競合を未然に防ぐだけでなく、仮想マシン対ホストの比率向上も可能になる。同じ物理ホスト数でより多くの仮想マシン(仮想デスクトップ)をサポートすることで、インフラのコスト削減と運用の効率化も実現する。

シナリオ2 パブリッククラウド環境のコスト削減

 コストとアプリケーション性能はトレードオフの関係にあるが、Turbonomicを使えば、最適なインスタンスやデータベース、ストレージの選択の他、RI(リザーブドインスタンス)の購入などにより、アプリケーション性能に影響を及ぼすことなくコスト削減が可能になる。例えば、Amazon Web Services(AWS)が2020年12月にリリースした“gp3”という新しいAmazon Elastic Block Store(EBS)ボリュームは、従来の“gp2”に比べてスループットが4倍向上している一方で、価格は15%ほど下がっており、迅速な変更によってコスト削減とアプリケーション性能向上の両方を実現できる。この他、マルチクラウド環境の管理統合も可能だ。

シナリオ3 ワークロードのクラウド移行

 クラウド移行に際し、準備にかかるコストと時間を削減したい、移行後のコストを最小限に抑えたいといったニーズにも有効だ。Turbonomicが、オンプレミス環境の仮想マシンのリソース利用状況を把握することで、クラウドに移行した場合の最適なインスタンスのサイズやストレージの種類などを自動的に選定する。オンプレミスの仮想マシンにありがちなオーバーサイズの問題を解決した上でクラウド移行でき、コスト最適化を実現できる。その結果、クラウド移行のプランニングを簡素化できる。

シナリオ4 コンテナ環境の性能管理と運用の効率化

 アプリケーション開発チームとDevOpsチーム、SRE(Site Reliability Engineering)チーム、IT運用チームなど異なるチームが関わるコンテナ環境では、チーム間でリソースの管理を統一したい、運用を効率化したい、クラスタのリソース利用効率を向上させたいといったニーズへの対応が重要になる。

 Turbonomicは、ポッドのリスケジュールやコンテナのスペック自動調整などにより、性能維持と同時にリソース利用効率の向上も実現する。共通の解析エンジンによるデータを異なる管理チームで共有することで運用効率化にもつながる。

 既に欧米を中心に3000社以上が利用するTurbonomic。2021年4月のIBMによる買収完了によって、国内企業でも導入が加速するものとみられる。複雑化したアプリケーションのリソース管理が限界を迎えつつある今、アプリケーションの性能劣化を防ぎたい、インフラ・クラウドのコスト削減をしたい、マルチクラウド環境の運用・管理を簡素化したいといった企業に向くだろう。

Copyright © ITmedia, Inc. All Rights Reserved.


提供:日本アイ・ビー・エム株式会社
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2021年10月26日

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。