AWS、「Amazon EC2 Capacity Blocks for ML」を提供開始、機械学習に必要なGPUを短期間利用可能に:NVIDIA H100 Tensor Core GPU搭載インスタンスを提供
AWSは、「Amazon Elastic Compute Cloud」(Amazon EC2)の新しい利用モデルである「Amazon EC2 Capacity Blocks for ML」の一般提供を開始した。
Amazon Web Services(AWS)は2023年10月31日(米国時間)、「Amazon Elastic Compute Cloud」(Amazon EC2)の新しい利用モデルである「Amazon EC2 Capacity Blocks for ML」の一般提供を開始したと発表した。
顧客はEC2 Capacity Blocks for MLにより、高パフォーマンスのML(機械学習)ワークロード用に設計されたAmazon EC2 UltraClustersにコロケーションされた数百のNVIDIA GPUを予約できる。
クラスタサイズ、将来の使用開始日、使用期間を指定することで、NVIDIA H100 Tensor Core GPUを搭載した「Amazon EC2 P5」インスタンスでEC2 Capacity Blocks for MLを使用できる。Amazon EC2 P5は、最新世代のGPUベースの高速コンピューティングインスタンスであり、ディープラーニングとハイパフォーマンスコンピューティング(HPC)において、Amazon EC2の中で最高のパフォーマンスを発揮するという。
EC2 Capacity Blocks for MLは、希望する使用開始日の8週間前から予約でき、使用期間は1〜14日、クラスタサイズは1〜64インスタンス(512 GPU)で指定することが可能だ。
EC2 Capacity Blocks for MLを導入した背景
AWSがEC2 Capacity Blocks for MLを導入した背景には、MLの進歩に伴い、多くの企業が商品開発やビジネス変革などにMLを利用するようになったことが挙げられる。MLモデルのトレーニング、微調整、実験、推論を行うためのGPU容量の需要の伸びが、業界全体の供給を上回っており、GPUが希少なリソースとなっているという。
「その結果、最新のML技術を利用したいと考える顧客、特に、導入段階によって容量ニーズが変動する顧客は、MLワークロードの実行に必要なGPUクラスタへのアクセスが困難になるかもしれない。あるいは、顧客は大量のGPU容量を長期間分、購入するかもしれないが、結局あまり使わず、アイドル状態になってしまう可能性もある。顧客は、長期間の利用を確約することなく、必要なGPU容量をより柔軟に、より高い予測精度でプロビジョニングする方法を探している」と、AWSは説明している。
EC2 Capacity Blocks for MLを利用すれば、MLワークロードの実行に必要なGPU容量を短期間だけ確保でき、使用していないGPU容量を保持する必要がなくなる。EC2 Capacity Blocks for MLはAmazon EC2 UltraClustersに展開され、第2世代Elastic Fabric Adapter(EFA)によるペタビットスケールネットワーキングで相互接続される。これにより、低レイテンシで高スループットの接続が確保され、数百のGPUまでスケールアップできる。
EC2 Capacity Blocks for MLの利用と料金
顧客は、AWS管理コンソール、CLI(コマンドラインインタフェース)、またはSDKを使用して、利用可能なEC2 Capacity Blocks for MLを見つけて予約できる。顧客は予約した時間分だけ料金を支払う。EC2 Capacity Blocks for MLは、AWSの米国東部(オハイオ)リージョンで提供されており、他のAWSリージョンやローカルゾーンでも利用可能になる予定だ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- AWS、「Amazon DataZone」の一般提供を開始 組織の境界を越えてデータプロジェクトに取り組める
Amazon Web Services(AWS)は、新しいデータ管理サービスである「Amazon DataZone」の一般提供を発表した。これは組織内のデータをカタログ化、発見、分析、共有、統制できる共通基盤サービスだ。 - 中堅中小企業のクラウド導入を加速させる「重要な5つの推奨事項」 AWSが発表
AWSは、AIとクラウドを活用して社会課題の解決に取り組む中堅中小企業に関するレポートを発表した。中堅中小企業がクラウド主導の技術を採用することで、2030年には医療、教育、農業の分野全体で年間総額1兆9000億円相当の生産性向上効果と520万人の雇用が生み出されるという。 - AWS、生成AIのマネージドサービス「Amazon Bedrock」を提供開始
Amazon Web Services(AWS)は、「Amazon Bedrock」の一般提供開始など、生成AIに関する4つのイノベーションを発表した。