AWS、最新世代GPUベースのEC2インスタンス「P5en」を追加して前世代の「P5」よりレイテンシを35％改善、その仕組みとは？：CPUとGPU間のスループットが4倍高速化

Amazon Web Services（AWS）は、「Amazon Elastic Compute Cloud（Amazon EC2）P5en」インスタンスの一般提供を開始した。

[＠IT] PC用表示関連情報

LINE

Hatena

　Amazon Web Services（AWS）は2024年12月2日（米国時間）、「Amazon Elastic Compute Cloud（Amazon EC2）P5en」インスタンスの一般提供を開始したと発表した。

　Amazon EC2 P5enは、最新世代のGPUベースのインスタンスファミリーである「Amazon EC2 P5」の新インスタンス。AWSは、このファミリーのインスタンスはディープラーニングとハイパフォーマンスコンピューティング（HPC）において、Amazon EC2の中で最高のパフォーマンスを発揮すると述べている。

Amazon EC2 P5enの仕組み、効果を発揮する使いどころは？

　Amazon EC2 P5enインスタンスは、NVIDIA H200 Tensor Core GPUと、AWSでのみ利用可能なオールコアターボ周波数3.2GHz（最大3.8GHz）のカスタム第4世代インテルXeonスケーラブルプロセッサを搭載する。

　P5enではこれらのプロセッサにより、メモリ帯域幅が50％拡大し、CPUとGPU間のスループット（データ伝送速度）がPCIe Gen5によって最大4倍に高速化しており、機械学習（ML）のトレーニングと推論ワークロードのパフォーマンスを向上させる。

　またP5enは、ネットワーク帯域幅が最大3200 Gbpsの第3世代Elastic Fabric Adapter（EFAv3）をクラウド基盤用カスタムチップのAWS Nitro v5とともに使用することで、前世代のEFAとNitroを使用する「P5」インスタンスと比べて、レイテンシが最大35％改善している。これはディープラーニングなどの分散トレーニングワークロード、生成AI（人工知能）、リアルタイムデータ処理、HPCアプリケーションのコレクティブ通信パフォーマンスの向上に役立つ。

　P5enと既存のP5ファミリーのインスタンス（P5、「P5e」）の仕様は以下の通り。

P5enとP5、P5eの仕様（出典：AWS）

　2024年9月にリリースされたAmazon EC2 P5eインスタンスは、低レイテンシと効率的なスケールアウトパフォーマンスを実現した。P5enでは、推論とネットワークのレイテンシがさらに低減しており、GPUアクセラレーションを利用した幅広いアプリケーションの全体的な効率を高めることができる。

　さらに、P5enはP5と比べて、ローカルストレージのパフォーマンスが最大2倍、Amazon Elastic Block Store（Amazon EBS）の帯域幅が最大25％向上している。このため、モデルの重みをキャッシュするためにローカルストレージを使用する場合、推論のパフォーマンスをさらに向上させることができる。

　また、CPUとGPU間のデータ転送は、特に、頻繁なデータ交換を必要とする大規模なデータセットやワークロードの場合、時間がかかることがある。P5enはPCIe Gen 5の採用により、P5およびP5eと比べて、CPUとGPU間の帯域幅が最大4倍に拡大しているため、複雑な大規模言語モデル（LLM）やマルチモーダル基礎モデル（FM）のモデルトレーニング、ファインチューニング、推論実行に加え、メモリ集約型HPCアプリケーション（シミュレーション、創薬、天気予報、財務モデリングなど）のレイテンシをさらに改善できる。

　AWSは、これらのAmazon EC2 P5ファミリーのインスタンスをMLやHPCに利用する場合、以下のAWSサービスと組み合わせることで、効率的に作業を開始できるとしている。

MLに利用する場合：Amazon SageMaker、AWS Deep Learning AMI（DLAMI）、AWS Deep Learning Containers、Amazon EKS、Amazon ECS
HPCに利用する場合：AWS Batch、AWS ParallelCluster

　Amazon EC2 P5enインスタンスは、EC2 Capacity Blocks for MLを介して、米国東部（オハイオ）、米国西部（オレゴン）、アジアパシフィック（東京）の各AWSリージョンと、米国東部（バージニア北部）リージョンのアトランタローカルゾーン（us-east-1-atl-2a）で利用できる。

AWS、最新世代GPUベースのEC2インスタンス「P5en」を追加して前世代の「P5」よりレイテンシを35％改善、その仕組みとは？：CPUとGPU間のスループットが4倍高速化

Amazon EC2 P5enの仕組み、効果を発揮する使いどころは？

関連記事

関連リンク